JPH02110795A - パターン同定処理方式 - Google Patents

パターン同定処理方式

Info

Publication number
JPH02110795A
JPH02110795A JP63264458A JP26445888A JPH02110795A JP H02110795 A JPH02110795 A JP H02110795A JP 63264458 A JP63264458 A JP 63264458A JP 26445888 A JP26445888 A JP 26445888A JP H02110795 A JPH02110795 A JP H02110795A
Authority
JP
Japan
Prior art keywords
pattern
identification
recognition
input
input pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63264458A
Other languages
English (en)
Other versions
JP2923295B2 (ja
Inventor
Hiroshi Kamata
洋 鎌田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP63264458A priority Critical patent/JP2923295B2/ja
Publication of JPH02110795A publication Critical patent/JPH02110795A/ja
Application granted granted Critical
Publication of JP2923295B2 publication Critical patent/JP2923295B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概要〕 文字1図形、および音声等のパターン認識装置における
パターン同定処理方式に関し。
人間が見ても一意に決定出来ない類似パターンは何れも
同順位の認識結果として得るようにして。
後の処理において入力パターンの規則性等を考慮して一
意に決定することを可能にし、正確なパターン認識を行
うことを目的とし。
入力パターンに同定条件を適用し認識結果を求めるパタ
ーン認識装置において、同定条件の結果に、「同定対象
カテゴリと共に特定の別カテゴリに属する」なる同定種
別を設け、入力パターンに同定条件を適用した結果とし
て上記同定種別が得られた場合、認識結果の同定対象カ
テゴリと特定の別カテゴリとを同一順位の認識結果とす
るよう構成した。
〔産業上の利用分野〕
本発明は文字9図形及び音声等のパターン認識装置にお
ける同定処理方式に関する。
パターン認識装置は文字(手書き文字を含む)や2図形
等の視覚的なパターンや、音声等の可聴的なパターンの
認識に用いられる。
一般に、パターン認識装置は認識候補を出力する大分類
部と該認識候補を入力として認識結果を出力する同定部
から構成され1年々、性能が向上してきている。
しかし、パターン認識装置において類似するパターンの
文字等を誤って認識結果とする場合がまだ多くあり、類
似パターンに対する同定性能の向上が強く要求されてい
る。人間が見た場合いづれとも認識できないような曖昧
なパターンに対してはいずれとも認識結果を出さず曖昧
である旨をそのまま残しておく認識自由度の高いより人
間に近い性能も要求されている。
本発明は、このような要求に応えるための改良された同
定処理方式を提供する。
〔従来の技術〕
第6図に、従来のパターン認識装置の構成を示す。図示
されたパターン認識装置は、パターン人力l、大分類部
2.認識対象人力3.同定部4゜認識結果出力5より構
成される。
また同定部4内には条件判定の出力論理がフローで示さ
れている。
次に、第6図を参照して、従来のパターン認識装置の動
作を説明する。
認識すべきパターンはパターン人力lに入力される。
認識対象人力3からは認識対象の種別2例えば。
ひらがな、漢字、アルファベント、カタカナ、数字、記
号等の認識すべきパターンの群種別に関する情報が入力
される。
パターン人力1及び認識対象人力3の情報は大分類部2
に入力される。大分類部2は、認識候補を求めて内蔵し
ている辞書を用いおおまかなパターンmva <入力パ
ターンの特徴を表すデータと辞書のデータを比較する等
の公知の技術による精度の低い認Va>を行い、ある程
度以上辞書のパターンと近似している(公知のDP法等
により入力パターンと辞書のパターンの距離が一定の範
囲内である)とそれを認識候補として絞り、複数個の認
識候補を得る。
大分類部2で得られた認識候補は、認識される確率の高
い順位を付して同定部4に入力される。
同定部4では認識候補についてそれに付随した同定条件
を用いて詳細な同定処理を行い、認識結果出力5を得る
次に、第7図の手書きパターンの例を用いて従来のパタ
ーン認識方式を具体的に説明する。
パターン人力1は大分類部2に送られる。大分類部2は
認識対象人力3の情報を参照して第1順位「すJ、第2
順位「+(漢字)Jを認識する。
第7図の手書きパターンを同定する条件の1例を第8図
及び第9図に示す。この同定条件は、2両目の曲がり度
により判定するものである。ここで、パターン■は第2
百目の曲がり度が81より小さいものであり、パターン
■は第7図の入力パターンである。パターン■は曲がり
度Bが第7図の入力パターンより大きい場合である。従
来の同定条件は1曲がり度Bに対し。
■ 曲がり度B〈閾値S1の時、[入力パターンは、「
す」に属さない。] ■ 闇値S1≦曲がり度Bの時、「入力パターンは、「
す」に属する。」 の2つの同定種別よりなる。
第8図に「す」に対する同定条件をまとめて表にして示
す。簡単に、入力パターンを「す」と認識する同定条件
は「十(漢字)」と識別すべきものだけであるとする。
同定部4は第7図の入力パターンに対しては、同定条件
■に従って入力パターンは「す」に属すると認識し、認
識結果出力5を得る。
入力パターンが第9図のパターン■のようなものである
時、同定部4は入力パターンは「す」に属さないと判定
する。そして3次に第2順位の候補「十」について同定
処理を行う。
〔発明が解決しようとする課題〕
上記のように、従来のパターン認識方式では入力パター
ンに同定条件を適用した結果として、その入力パターン
は、認識候補との同定条件を満たすか満たさないか何れ
かに結論していた。同定条件を満たさない場合には2次
の順位の文字等の認識コードの同定条件を参照し、必ず
1つの認識結果を得るようにしていた。
しかし2手書き文字等における「ア」、「マ」あるいは
、前述の「すJ、「+(漢字)」のようにパターンによ
っては人間でも何れを意味するパターンであるのか決め
難いものが多い。
−船釣に、いま、パターンC1,C2を類似パターンカ
テゴリとする、入力パターンをIとし人間が見た時C1
にもC2にも属するように見えるとする。大分類部2の
第1順位の認識候補を01とする。簡単化のため入力パ
ターンと、C1の同定条件は、CIを02と識別するた
めの条件のみから成るものとする。従来の認識方式では
、入力パターンlに該同定条件を適用した結果は1次の
何れかである。
(1)■はC1に属さない。
(2)IはC1に属する。
同定部4における結果が(1)の場合には、CIは認識
結果でなくなる。結果が(2)の場合には、CIのみが
認識結果とされ、C2は認識結果でなくなる。
本来、パターンIはカテゴリC1にもC2にも属する可
能性のあるものであるから、何れにも同定されるべきも
のである。従って、このような結果は、不正確である。
本発明のパターン同定処理方式は1人間が見ても一意に
決定できないような類似したパターンは何れも同順位の
認識結果とし得るようにする。そして、後の処理におい
て例えば一連の入力パターン間に存在する種々の規則性
を考慮して一意に決定することを可能にし、正確なパタ
ーン認識を行うことを目的とする。
〔課題を解決するための手段〕
本発明では、前述した課題を解決するため入力パターン
に同定条件を適用した結果として、従来の同定種別であ
る ■ 同定対象カテゴリに属さない。
■ 同定対象カテゴリに属する に加えて。
■ 同定対象のカテゴリと共に特定の別カテゴリにも属
する。
を同定種別として認識結果を出力できるようにしたもの
である。ここで「同定対象カテゴリ」は。
未知の入力パターンを認識する同定処理で候補として使
用された参照用の既知パターンを意味している。
第1図は本発明によるパターン認識装置の原理的構成図
である。
図示されている本発明によるパターン認識装置の全体構
成は、第6図の従来例の構成と同定部を除いて基本的に
は同じである。
第1図において。
1はパターン入力であり、音声や文字9図形などの認識
しようとする未知のパターン情報が入力される。
2は大分類部であり、認識処理効率を上げるため予め粗
い情報のパターン認識を行い、認識候補としである程度
類似している一定範囲のものに絞る。
3は認識対象入力であり、認識しようとする未知の入力
パターンが属するパターン群の種別、たとえば文字の場
合は「漢字」、「カタカナ」。
「英数字」、などの文字属性や品詞1文法規則などの種
別を示す認識対象カテゴリが指定される。
これらは認識効率と精度を上げるために使用される。
4は同定部であり、大分類部2が作成した認識候補の各
々について本発明に基づく入力パターンの同定処理を行
い、結果を出力する。
認識対象人力3から指定される認識対象カテゴリは、大
分類部2と同定部4にそれぞれ人力される。大分類部2
では処理の結果複数の認識候補に属するものを高位に順
位付けるように使用され。
また同定部4では適用する同定条件の範囲を、指定され
ている認識対象カテゴリが関係するものに限定するよう
に使用される。
第1図における同定部4内に本発明による同定処理の出
力論理を示す。以下にその論理を説明する。
条件判定により、入力パターンIは同定対象カテゴリC
1に属するかどうかを判定する。その結果がNoの場合
には、入力パターンIは、■「同定対象カテゴリに属さ
ない」を認識結果として出力する。
入力パターンIが、同定対象カテゴリCHこ属すると判
定した場合には、さらにCIに類似の特定の別カテゴリ
C2に属するかどうかの判定処理を行う。その結果がN
Oの場合には入力パターンIは、■[同定対象カテゴリ
C1に属する]を認識結果として出力する。他方、その
結果がYESの場合には入力パターンIは、■「同定対
象カテゴリC1と共に他の特定の別カテゴリC2にも属
する」を認識結果として出力する。
〔作用〕
このようにして、特定のパターンに属すると人間でも決
められない入力パターンについては、属する可能性のあ
るパターンを全て認識結果第1位とするようにしたもの
である。そして、後の処理でパターンの順序の規則性に
従って認識結果を一意に決定することを可能にした。
例えば、入力パターンをI、類似したカテゴリパターン
をCI、C2(例えば、「ア」と「マ」。
「す」と「十(漢字)」等)とする。人間がみた時は、
入力パターンは、CIにもC2にも属するように見える
ものとする。そして、大分類における認識候補第1位を
01とする。簡単化のため入力パターンIをCIとする
同定条件は、C2と識別するための条件のみから成るも
のとする、入力パターンに該同定条件を適用した結果を
1次の何れかとする。
■ IはC1に属さない。
■ IはCIに属する。
■ ■はC1にもC2にも属する。
そして、入力パターンIが人間が見た時c1ともC2と
も見えるようなものである時には、■を結論し、C1,
C2を同順位に認識結果とする。
そして、後の処理で、CI、C2の使われ方の規則性に
従って一意に決定するようにする。
次に、具体的に、第7図の手書き文字の入力パターンに
より説明する。人間が見た時この手書き文字は、「す」
とも「十(漢字)」とも読めるものである。そして、大
分類部により、認識候補として、第1位「す」、第2位
「+」が求められたとする。
同定部は、まず入力パターンに認識候補第1位「す」の
同定条件を適用する、入力パターンを「す」と認識する
「す」の同定条件は「+(漢字)」と識別するための条
件のみから成るものとする。
この同定条件を第2図に表にして示す。第3図にこの手
書きパターンの第二両目の曲がり度とパターンカテゴリ
の関係を示す。この同定条件は。
第2画の時計回り方向の曲がり度Bをパラメータとして
、闇値で判定するものとする。第3図でパターン■ば、
第2両目の曲がり度が閾値s1より小さいものである。
パターン■は第7図のパターンで、その第2両目の曲が
り度が閾値S1より大きくS2より小さい。パターン■
は、第2両目の。
曲がり度が閾値S2より大きい。
即ち、■ 曲がり度B〈閾値s1 の時、「入力パター
ンは、「す」に属さない。」 ■ 閾値S1≦曲がり度B〈閾値S の時、[入力パタ
ーンは、「す」に属す ると共に、「十」に属する。」 ■ 閾値S2≦曲がり度B の時、[入カバターンは、
 「す」に属する。」 第7図の入力パターンにこの同定条件を適用した結果は
2条件■により、[人カバターンは。
「す」とともに「+」に属する。]であり、認識結果と
して、「す」及び「十」が得られる。
入力パターンは、「す」とも「十」とも同じ程度に確か
らしく見えるのでこの結果は適切である。
本発明のパターン同定方式によれば9人間でも。
特定のパターンに属すると判定出来ない曖昧な入力パタ
ーンについては、属する可能性のあるパターンを全て同
順位の認識結果とすることができる。
そのため、その後の処理において2語順等の規則性を考
慮して一意に決定するようにしたので、より人間に近い
正確なパターン認識ができる。
(第1の実施例) 第4図に本発明によるパターン認識装置の第1の実施例
の構成を示す。
第4図において10は認識対象入力部、11は認識対象
格納部、12はパターン入力部、13は入力パターン格
納部、14は大分類部、15は認識候補格納部、16は
同定部、17は認識結果格納部である。
また同定部16において、161は候補コード格納部、
162は同定条件検索部、163は条件判定部、164
は同定条件格納部、165は同一順位候補格納部を表す
動作を説明すると、パターン入力部12から未知のパタ
ーンを入力し、入力パターン格納部13に格納する。
認識対象入力部10からは認識対象カテゴリ。
すなわち認識すべきパターンが属するカテゴリの種類に
関する情報を入力し、認識対象格納部11に格納してお
く。認識対象格納部11に格納された認識対象カテゴリ
の種類情報は大分類部14に人力される、入力パターン
格納部13からの入力パターンは大分類部14において
認識候補を求める大まかなパターン認識(入力パターン
の特徴を表すデータと辞書のデータを比較する等の公知
の技術による精度の低い認識)を行い、ある程度以上辞
書のパターンと近似している(公知のDP法等により入
力パターンと辞書のパターンの距離が一定の範囲内であ
る)とそれを認識候補とし、1つないし複数個の認識候
補を得る。1つの場合は詳細同定を行う必要がない。
認識候補格納部15には大分類部14から、認識する確
率の高い順に認識候補が格納され、同定部16ではその
認識候補について同定条件を用いて、入力パターン格納
部13に格納されたパターンが条件を満たすかどうかを
判別し5条件を満たさないと、別の候補についての同定
条件により同様の処理を行って1条件を全て満たす認識
候補のコードを認識結果コードとして出力し、認識結果
格納部17に格納する。
次に同定部16の動作を説明すると、まず認識候補格納
部15に格納した認識候補第1位のコードを、候補コー
ド格納部161に格納する。同定条件検索部162は候
補コード格納部161に格納したパターンの候補コード
に対応する同定条件プログラムを同定条件格納部164
から検索し。
条件判定部163中のメモリ(図示せず)に格納する。
同定条件格納部164には、候補コードと識別コードの
対ごとに同定条件プログラム(実際にはその格納アドレ
ス)が対応づけられている。
多くの場合、1つの認識候補パターン(1つの候補コー
ドが対応)に対してそれと区別されるべき1つないし複
数の類似パターンが存在する。そこでそれらを識別コー
ドで別々に指定して、各候補コードごとに1つないし複
数の組み合わせを作り、それらの各組み合わせごとに1
つの同定条件プログラムを作成して同定条件格納部16
4に格納しである。
したがって同定条件検索部162は、候補コード格納部
161の1つの候補コードについて1組み合わされてい
る異なる識別コードに対応する1つないし複数の同定条
件プログラムを、同定条件格納部164から順次検索し
3条件判定部163に格納して実行させる。
条件判定部163に格納された同定条件プログラムは、
従来のパターン認識装置の場合の■候補コードに属さな
い、■候補コードに属する。という結果の他に、■候補
コードと識別コードの両方に属するという結果を返すこ
とができる。
条件判定部163は[3]の結果が返ってきた時に。
同定条件に付随する識別コードを同一順位候補格納部1
65に格納する。
同一の候補コードに対して、各同定条件プログラムの結
果が全て■か■であり、新たに適用する同定条件プログ
ラムが無くなった時にその候補コード及び同一順位候補
格納部165中に格納されている識別コードを、同一順
位の認識結果として認識結果格納部17に格納する。
以上述べた実施例は、同定対象カテゴリのコードである
候補コードと同定対象カテゴリに付随する識別対象カテ
ゴリのコードである識別コードとの対毎に同定条件を設
け、付随する各同定条件を全て満たす同定対象カテゴリ
を認識結果とするものであった。
しかし、容易に類推できるように、同定対象カテゴリの
み毎に、入力パターンが該同定対象カテゴリに属するこ
とを判定する同定条件を設けたパターン認識装置につい
ても1本発明が適用できることは明らかである。
具体的には、同定対象カテゴリ毎に、入力パターンがそ
の同定対象カテゴリに属することを判定する同定条件を
設けたパターン認識装置において。
入力パターンに文字同定条件を適用した結果として。
■′その同定対象カテゴリに属さない。
■′その同定対象カテゴリに属する。
■′その同定対象カテゴリと共に特定の別カテゴリにも
属する。
のいずれかを返し、■′の場合にはその同定対象カテゴ
リと特定の別カテゴリを同一順位の認識結果とするもの
である。
(第2の実施例) 第5図は本発明の同定部を備えた第2の実施例であり、
第4図の第1の実施例の構成から大分類部14と認識候
補格納部15を取り除いたものである。
本実施例における同定部の条件判定は、第4図の同定部
16の条件判定と同じである。
認識対象のカテゴリが限られているような場合には(例
えば、数字のみから成るような場合)。
大分類を行う必要が無く、同定部だけでパターンを識別
できる。このような時、第5図のパターン認識装置が用
いられる。
この場合には認識対象カテゴリに属する全てのパターン
のコードをそのまま認識候補(数字なら0〜9)として
、それぞれの同定条件に基づいて同定部16において順
次大カバターンの同定処理を行う。
同定部16の条件判定は第4図の同定部16と同じであ
るのでその動作の説明は省略する。
〔発明の効果〕
本発明によれば9人間でも、特定のパターンに属すると
判定出来ない曖昧な入力パターンについては、属する可
能性のあるパターンを全て同順位の認識結果とし、その
後の処理において1語順等の規則性を考慮して一意に決
定するようにしたので、従来のものよりも正確なパター
ン認識ができる。
【図面の簡単な説明】
第1図は本発明によるパターン認識装置の原理的構成図
。 第2図は本発明における「+」と識別するための「す」
の同定条件の説明図。 第3図は本発明における「+」と「す」を識別するため
の曲がり度の条件説明図。 第4図は本発明によるパターン認識装置の第1の実施例
の構成図。 第5図は本発明によるパターン認識装置の第2の実施例
の構成図。 第6図は従来のパターン認識装置の構成図。 第7図は手書きパターンの例の説明図。 第8図は従来の「十」と識別するための「す」の同定条
件説明図。 第9図は従来の、「十」と「す」を識別するための曲が
り度の条件説明図である。 第1図中、1:パターン入力、2:大分類部。 3:認識対象入力、4:同定部、5;認識結果出力。

Claims (2)

    【特許請求の範囲】
  1. (1)入力パターンに同定条件を適用し認識結果を求め
    るパターン認識装置において、同定条件の結果に、「同
    定対象カテゴリと共に特定の別カテゴリに属する」なる
    同定種別を設け、入力パターンに同定条件を適用した結
    果として上記同定種別が得られた場合、認識結果の同定
    対象カテゴリと特定の別カテゴリとを同一順位の認識結
    果とするパターン同定処理方式。
  2. (2)請求項1において、同定対象カテゴリ毎に、入力
    パターンが該同定対象カテゴリ毎に属することを判定す
    る同定条件を設け、入力パターンに同定条件を適用した
    結果の同定種別として、 [1]該同定対象カテゴリに属さない、 [2]該同定対象カテゴリに属する、 [3]該同定対象カテゴリと共に特定の別カテゴリにも
    属する、 のいずれかを返し、上記[3]の場合にはその同定対象
    カテゴリと特定の別カテゴリとを同一順位の認識結果と
    することを特徴とするパターン同定処理方式。
JP63264458A 1988-10-20 1988-10-20 パターン同定処理方式 Expired - Fee Related JP2923295B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63264458A JP2923295B2 (ja) 1988-10-20 1988-10-20 パターン同定処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63264458A JP2923295B2 (ja) 1988-10-20 1988-10-20 パターン同定処理方式

Publications (2)

Publication Number Publication Date
JPH02110795A true JPH02110795A (ja) 1990-04-23
JP2923295B2 JP2923295B2 (ja) 1999-07-26

Family

ID=17403489

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63264458A Expired - Fee Related JP2923295B2 (ja) 1988-10-20 1988-10-20 パターン同定処理方式

Country Status (1)

Country Link
JP (1) JP2923295B2 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6089291A (ja) * 1983-10-19 1985-05-20 Sharp Corp 文字認識方式
JPS6089290A (ja) * 1983-10-19 1985-05-20 Ricoh Co Ltd パタ−ン認識方法
JPS61272887A (ja) * 1985-05-28 1986-12-03 Toshiba Corp 文字認識方式
JPS6228889A (ja) * 1985-07-31 1987-02-06 Canon Inc 情報認識装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2644859B2 (ja) 1988-11-14 1997-08-25 富士通株式会社 パターン詳細同定装置の同定処理方式

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6089291A (ja) * 1983-10-19 1985-05-20 Sharp Corp 文字認識方式
JPS6089290A (ja) * 1983-10-19 1985-05-20 Ricoh Co Ltd パタ−ン認識方法
JPS61272887A (ja) * 1985-05-28 1986-12-03 Toshiba Corp 文字認識方式
JPS6228889A (ja) * 1985-07-31 1987-02-06 Canon Inc 情報認識装置

Also Published As

Publication number Publication date
JP2923295B2 (ja) 1999-07-26

Similar Documents

Publication Publication Date Title
CN110096572B (zh) 一种样本生成方法、装置及计算机可读介质
CN112256845A (zh) 意图识别方法、装置、电子设备和计算机可读存储介质
CN114357120A (zh) 基于faq的无监督式检索方法、系统及介质
CN113076758A (zh) 一种面向任务型对话的多域请求式意图识别方法
Purevdagva et al. A machine-learning based framework for detection of fake political speech
JPH09282331A (ja) 文書類似判定装置および文書類似判定方法
JPH02110795A (ja) パターン同定処理方式
JPH08221447A (ja) 文書自動分類装置
US9846739B2 (en) Fast database matching
JPH0528324A (ja) 英文字認識装置
Diekema et al. Question answering: CNLP at the TREC-2002 question answering track
JP2637762B2 (ja) パターン詳細同定方式
JPS646514B2 (ja)
CN115617999A (zh) 一种资讯信息的处理方法、装置及设备
JPH0944604A (ja) 文字認識処理方法
JPS6169099A (ja) 音声認識装置
JPS60138689A (ja) 文字認識方法
JPS63268082A (ja) パタ−ン認識装置
JPS63138479A (ja) 文字認識装置
JPS61107486A (ja) 文字認識後処理方式
JPS63100584A (ja) 文字認識処理方式
CN116910338A (zh) 文本补全方法、装置、电子设备和计算机存储介质
CN110008307A (zh) 一种基于规则和统计学习的变形实体识别方法和装置
CN116090435A (zh) 一种文本知识库智能知识选取消歧方法和系统
JPS6146995A (ja) 音声認識システム

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees