JPH05274436A - パターン認識方法及び装置 - Google Patents

パターン認識方法及び装置

Info

Publication number
JPH05274436A
JPH05274436A JP5020334A JP2033493A JPH05274436A JP H05274436 A JPH05274436 A JP H05274436A JP 5020334 A JP5020334 A JP 5020334A JP 2033493 A JP2033493 A JP 2033493A JP H05274436 A JPH05274436 A JP H05274436A
Authority
JP
Japan
Prior art keywords
pattern
recognition
reliability
candidate
pattern recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP5020334A
Other languages
English (en)
Inventor
Toshiaki Yagasaki
敏明 矢ケ崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of JPH05274436A publication Critical patent/JPH05274436A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/248Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
    • G06V30/2504Coarse or fine approaches, e.g. resolution of ambiguities or multiscale approaches

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 (修正有) 【目的】 未知パターンを高信頼度で認識することがで
きない場合を検出する。 【構成】 パターン認識装置は、画像データ入力装置S
601、画像データから未知パターンを切り出すホスト
S602、ホストCPUから入力された未知パターンに
対する認識候補を出力する文字認識装置とを備える。文
字認識装置は、信頼性指標を出力する信頼性指標部を備
え、信頼性指標は未知パターンと既知パターンとの近さ
に基づいて決定される。また、信頼性指標は未知パター
ンを異なる認識関数で認識したときの一致度に基づいて
決定される。最適認識候補の距離値が所定距離より小さ
ければ、認識候補は許容可能であると判断され、処理を
S608とS609に進めて、後処理と表示処理を行な
う。さらに、信頼性指標は認識候補と既知パターンとの
距離が所定レベル以上であれば信頼性は低いので認識候
補をS613に進めて出力しないように決定される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はパターン認識のための方
法及び装置に関するものであり、特に未知パターンの認
識候補を選択する際の信頼性指標を求める方法及び装置
に関するものである。
【0002】
【従来の技術】パターン認識システムでは、未知パター
ン、例えば画像スキャナから入力したパターンやファク
シミリ転送で受信したパターンを分析して、パターンの
認識結果を出力する。図15は、画像中に含まれる複数
の文字を認識する一般的なパターン認識の処理の流れを
示す図である。
【0003】図15において、ステップS1501で、
画像、例えば画像スキャナから入力した画像を入力し、
ステップS1502で画像中の個々の文字が切り出され
る。ステップS1501とS1502とは一般に汎用ホ
ストコンピュータで実行され、ステップS1502で切
り出された文字は所定の光学文字認識装置に転送され
る。ステップS1503では、光学文字認識装置におい
て切り出された文字に対して特徴抽出処理を行い、未知
パターンの特徴ベクトルを求める。特徴ベクトルは、ス
トローク位置,方向,長さなどのパターンに関する様々
な特徴を表すベクトルである。
【0004】次いで、大分類のステップS1504にお
いて、未知パターンの特徴ベクトルと複数の標準パター
ンの特徴ベクトルとの比較処理を行う。すなわち、未知
パターンの特徴ベクトルと標準パターン辞書内の各特徴
ベクトルとの比較処理を行い、未知パターンの特徴ベク
トルと標準パターンの特徴ベクトル間の数学的距離であ
る距離値を計算する。次いで、距離値をソートして、最
良候補、例えば未知パターンの特徴ベクトルに近い上位
52個の候補を選択する。ステップS1505では、こ
れらの最良候補に対して詳細分類を行う。詳細分類処理
では、他の識別関数、例えば擬似ベイズ(pseudo-boyesi
an) 識別関数を用いて、大分類処理において求めた候補
の中から最適な1つの候補あるいは最適な複数の候補を
選択する。次いで、未知パターンに対する最適な1つあ
るいは複数の候補を汎用ホストコンピュータに転送し、
ステップS1506の後処理を施す。後処理では、一般
に、スペルチェック,内容チェック,構文チェック処理
などを行い、未知パターンに対して1つの候補を選択す
る。
【0005】
【発明が解決しようとする課題】しかしながら、図15
に示す処理によれば未知パターンを高精度に認識するこ
とができるが、問題点は依然として残っている。すなわ
ち、未知パターンを必ずしも高信頼度で認識できるとは
限らず、最適候補であっても精度には疑問が残る場合が
ある。
【0006】したがって、本発明の目的は、未知パター
ンを高信頼度で認識することができない場合を検出する
ことにある。本発明のさらなる目的は、未知パターンを
高信頼度で認識することができないという指標を求める
ことである。これにより、未知パターンの最適認識候補
であっても精度には疑問が残るような場合に、未知パタ
ーンの認識精度が低いことを示すことができる。
【0007】
【課題を解決するための手段】本発明のパターン認識装
置は、未知パターンに対する認識候補を求めるパターン
認識手段と、認識候補の信頼度を決定する信頼度決定手
段と、認識候補の信頼度が所定値より高い場合に認識候
補を出力し、信頼度が所定値より低い場合には認識失敗
信号を出力する処理手段とを備える。
【0008】また、画像情報からパターンを切り出すホ
ストと、該ホストから転送されたパターンに対する認識
候補を出力し、認識候補の信頼度を決定する信頼度決定
手段を有するパターン認識手段とを備え、該ホストは、
認識候補の信頼度が所定値より高い場合に認識候補を出
力し、信頼度が所定値より低い場合には認識失敗信号を
出力する。
【0009】また、ネットワークバスと、該ネットワー
クバスに接続され、画像情報を入力するための画像入力
手段と、該ネットワークバスに接続され、未知パターン
に対する認識候補を求め、認識候補の信頼度を決定する
信頼度決定手段を有するパターン認識手段と、該ネット
ワークバスに接続された複数の処理手段であって、各該
処理手段は、前記画像入力装置から入力された画像情報
からパターンを切り出し、パターンを前記パターン認識
手段に入力し、前記パターン認識手段から認識候補と信
頼度とを受信する複数の処理手段とを備える。
【0010】本発明のパターン認識方法は、未知パター
ンに対する認識候補を出力する行程と、認識候補の信頼
度を計算する行程と、高信頼度の場合に認識候補を出力
し、低信頼度の場合に認識失敗信号を出力する行程とを
備える。また、画像情報からパターンを切り出す行程
と、パターンに対する認識候補を出力する行程と、認識
候補の信頼度を計算する行程と、高信頼度の場合に認識
候補を出力し、低信頼度の場合に認識失敗信号を出力す
る行程とを備える。
【0011】また、ネットワークバスに接続された画像
入力手段から画像情報を入力する行程と、前記画像情報
からパターンを切り出す行程と、前記パターンごとに認
識候補を出力する行程と、各認識候補の信頼度を計算す
る行程と、各パターンに対する認識候補と信頼度とをネ
ットワークバス上に転送する行程とを備える。
【0012】
【実施例】図1は、本実施例のパターン認識装置の全体
構成を示すブロック図である。図1に示す通り、パター
ン認識装置は、プログラマブル・マイクロプロセッサ
(例えば、EZPS3500)などのホストCPU1
0、画像スキャナやファクシミリ受信装置などの画像デ
ータ入力装置11、入力装置11から入力された画像デ
ータを記憶する画像メモリ12、ホストCPU10から
SCSIインタフェース13を介して転送された未知パ
ターンを認識し、未知パターンの候補をインタフェース
13を介してホストCPUに転送する文字認識装置1
4、文字認識装置14から転送された候補を記憶する文
字メモリ15、パターン認識結果を表示するディスプレ
イ16を備える。
【0013】図2は、文字認識装置14の詳細な構成を
示すブロック図である。図2に示す通り、文字認識装置
14は通信部と認識部とから構成される。通信部は、プ
ログラマブル・マイクロプロセッサ68000などのマ
イクロプロセッサ21が接続される通信バス20、マイ
クロプロセッサ21において実行される処理ステップを
保持するプログラマブル・リードオンリーメモリ(PR
OM)22、ホストCPU10との通信をバッファリン
グするバッファメモリ24、ホストCPU10とのダイ
レクトメモリアクセス(DMA)を制御するためのDM
A制御部25、ホストCPU10とインタフェース13
を介して通信するためのSCSI制御部26、通信部と
認識部との間で内部的なバッファリングを行う内部バッ
ファメモリ27を備える。
【0014】認識部は、上述の内部バッファメモリ27
ならびにテキサスインスツルメンツ製デジタル信号プロ
セッサ(TMS302C25)などのデジタル信号プロ
セッサ(DSP)が接続される認識バス29、DSP3
0において実行される処理ステップを保持するPROM
31、未知パターンから特徴ベクトルを抽出する特徴抽
出装置32、未知パターンに対する認識候補を辞書RO
M35aと35bから複数個選択する大分類装置34、
詳細辞書データを用いて大分類での認識候補を絞りホス
トCPU10に送って後処理を行うための詳細辞書RO
M36とを備える。
【0015】図3は、大分類装置34の詳細な構成を示
すブロック図である。図3に示すように、大分類装置3
4は主制御ロジック37を備え、大分類装置34中の様
々な構成要素を制御する。すなわち、主制御ロジック3
7は辞書制御部39、分類部40、ソート部41、デー
タRAM44を制御するRAM制御部42を制御する。
また、新しい出力が得られると、主制御ロジック37は
新しい処理結果が出力可能であることを示す「新しい提
案出力」フラグ(NPO)をDSP30に対してたて
る。
【0016】具体的には、辞書制御部39は、辞書RO
M35aと35bとを制御する。図3に示すように、辞
書制御部39は、インタリーブ制御信号45と辞書アド
レス46とを出力する。このような信号によって、辞書
ROM35aと35bとを同時に読み出すことが可能と
なり、辞書ROMを交互に読み出す場合よりも高速に辞
書中の特徴ベクトルを分類部40に入力することができ
る。尚、ここでは図示していないが、3つ以上の辞書R
OMを読み出す際にこれらの信号を用いることも可能で
ある。
【0017】分類部40は、辞書特徴ベクトルと未知パ
ターンの特徴ベクトルとの間の距離を計算するための演
算部を2つ(辞書ROMごとに1つずつ)備えている。
分類部40は、主制御ロジック37からの制御に応じ
て、3つの距離関数、すなわちマハラノビス距離関数,
絶対値平均距離関数,2乗平均距離関数のうちの1つを
用いて距離の計算を行う。具体的には、マハラノビス距
離関数を用いる場合には、未知パターンの特徴ベクトル
Xと辞書ROMからの特徴ベクトルWとの間の内積が計
算される。
【0018】
【数1】
【0019】ここで、kmaxは特徴ベクトルの次元数
であり、z=−2C-1W(Cは辞書ベクトルの平均共分
散行列)、X0 =1、W0 =WT-1Wである。絶対値
平均距離関数を用いる場合には、未知パターンの特徴ベ
クトルXと辞書ROMからの特徴ベクトルWとの間の絶
対値距離の全てを加算する。
【0020】
【数2】
【0021】2乗平均距離関数を用いる場合には、未知
パターンの特徴ベクトルXと辞書ROMからの特徴ベク
トルWとの間の距離の2乗が加算される。
【0022】
【数3】
【0023】このように計算された距離値は、距離値に
対応する候補とともに、ソート部41に入力される。ソ
ート部41では、分類部40から入力される距離値を、
主制御ロジック37からの制御信号に応じて昇順あるい
は降順でソートする。
【0024】ソート部41については、本出願の発明者
による1990年7月19日出願の米国出願番号07/
554384(対応日本出願特開平4−227532
号)に詳細に記されている。
【0025】分類部40が辞書ROM35aと35b中
の各特徴ベクトルを処理すると、主制御ロジック37
は、ソート部41に対して、ソートされた距離値ならび
に対応する認識候補とをデータRAM44に転送するよ
うに指示する。データRAM44はRAM制御部42と
主制御ロジック37との制御に応じて、ソートされた距
離値と対応する認識候補とを連続する記憶位置に記憶す
る。ここで、データRAM44の記憶容量を効率良く使
用するためには、距離値と認識候補とのどちらか一方を
データRAMに記憶することが好ましい。尚、この選択
は、RAM制御部42からの制御に応じて行われる。
【0026】図4は、大分類装置34の動作を説明する
ためのフローチャートである。ステップS41におい
て、DSP30は制御語をRAM制御部42中の制御レ
ジスタ42aに書き込む。図5は、制御語のビット割り
当てを示したものである。図示のように、ビット15は
開始ビットであり、大分類装置34に対して分類/ソー
ト処理の開始を指示する。ビット14はタグビットであ
り、ソート部41からの距離値をデータRAM44に記
憶するか、あるいはソート部41からの認識候補を記憶
するかを装置に指示するために用いられる。ビット13
は、ソート処理を昇順で行うか、降順で行うかを示すビ
ットである。ビット9と10とは、大分類装置がソート
処理を行わずに単に距離値を計算して、データRAM4
4で単にデータをソートするのか、あるいは距離値計算
と計算された距離値のソート処理とを2つとも行うのか
を示すビットである。ビット7と8は、上述のマハラノ
ビス距離関数,絶対値平均距離関数,2乗平均距離関数
のうち、どの距離関数を分類部40で用いるかを示すビ
ットである。ビット6は、データRAM44中に上位1
00個の認識候補を記憶するのか、上位52個の認識候
補を記憶するのかを示すビットである。ビット5は、辞
書ROM35aと35b中でデータをアクセスし始める
位置を示すビットである。ビット5に1がセットされる
と、辞書ROMは最初からアクセスが開始される。一
方、ビット5に0がセットされると、辞書ROMは最後
のアクセスアドレスからアクセスが開始される。ビット
0〜2は辞書ROMモードを示すビットであり、装置中
の辞書ROM数とこれらの辞書ROMに対するインタリ
ーブ法とを示している。
【0027】図4に戻り、ステップS42において、D
SP30は未知パターンの特徴ベクトルを認識バス29
に出力し、RAM制御部42は特徴ベクトルをデータR
AM44中の連続する位置に記憶する。ステップS43
では、ソート部41のメモリを所定値に初期化して、ソ
ート処理に備える。
【0028】ここでの所定値は、昇順ソートであるか降
順ソートであるかに応じて、予測される最大値あるいは
予測される最小値にセットされる。尚、図7を参照して
以下に詳細に説明するが、ほかの初期値を用いることも
可能である。
【0029】ステップS44において、データRAM4
4は開始ビット15に応じて未知パターンの特徴ベクト
ルを分類部40に入力する。次いで、辞書制御部39は
ROMアクセス開始ビット5に示される順序で辞書RO
M35aと35bとにアクセスし、辞書ROM中の認識
候補パターンに対応する特徴ベクトルを分類部40に入
力する。この際、マハラノビス距離関数を用いる場合に
は、辞書特徴ベクトルWを式(1)において上述したよ
うに前処理して中間ベクトルZ=−2C-1Wを求めてお
き必要がある。一方、図示してはいないが、マハラノビ
ス距離関数が選択されるときに限り、別の辞書を用いる
こともできる。この別の辞書には、式(1)にしたがっ
て前処理され、未知の特徴ベクトルに対して直接適用す
ることのできる特徴ベクトルが記憶される。
【0030】ステップS45において、分類部40は未
知特徴ベクトルと認識候補特徴ベクトルとの間の距離値
を計算する。距離値を計算する際に用いる距離関数は、
制御レジスタ42aに保持される制御語のビット7と8
によって選択される。ステップS46では、新しく計算
された距離値をソート部41に入力する。ソート部41
は新たな距離値をそれ以前に計算されている距離値中
に、上述の特開平4−227532号に示す手法でソー
トする。このソート処理は、制御レジスタ42a中の制
御語のビット6に応じて、上位100個もしくは上位5
2個の認識候補を用いて行われ、ビット13に応じて昇
順あるいは降順で行われる。
【0031】辞書ROM35aと35bにほかの特徴ベ
クトルが残っている場合には、ステップS47において
制御がステップS43に戻される。一方、すべての特徴
ベクトルの処理を終えると、処理はステップS48に進
み、ソートされた認識候補とともにソートされた距離値
がデータRAM44に書き込まれる。RAM44は、制
御レジスタ42a中の制御語のビット14に応じて、距
離値あるいは認識候補のどちらかを記憶する。データは
データRAM44の連続する位置に書き込まれ、ステッ
プS42で記憶した未知特徴ベクトルのデータに重ね書
きされる。
【0032】ステップS49において、大分類装置34
はNPOフラグ(図3参照)をたて、DSP30に新し
い提案出力が入力可能である旨を示す。すると、デジタ
ル信号プロセッサ30は認識バス29を介してデータR
AM44を読み出し、以下詳述するようにソートされた
データの処理を行う。図6は、図1,図2,図3に示し
たパターン認識装置の動作を説明するフローチャートで
ある。図6に示す処理ステップは、ホストCPU10の
不図示のメモリ、マイクロプロセッサ21のPROM2
2、DSP30のPROM31中でコンピュータプログ
ラムとして保持されており、以下の説明から明らかなよ
うに、それぞれホストCPU10、マイクロプロセッサ
21、デジタル信号プロセッサ30において実行され
る。
【0033】図6に示す処理では、大分類装置34にお
いてソートされたデータに対して、ソート部41でソー
トされた距離値に基づいて信頼度を求める。距離値が所
定のしきい値よりも小さい場合には、大分類処理の信頼
度は高い。一方、距離値が所定レベル以上であれば、大
分類処理において判断された認識候補の信頼度は低く、
認識処理の失敗となる。
【0034】ステップS601において、画像データは
入力装置11からホストCPU10に入力される。ホス
トCPU10は画像データを画像メモリ12に記憶し、
ステップS602において画像を個々のパターンとして
切り出す。ホストCPU10は順次切り出されたパター
ンをインタフェース13を介して文字認識装置14に転
送する。
【0035】ステップS603において、文字認識装置
14はSCSIコントロ−ラ26を介して未知のパター
ンを入力し、未知パターンをバッファメモリ24に保持
する。バッファメモリ24は、ホストCPU10から転
送されたパターンを保持し、認識バス29にパターンを
連続して出力できるように、マイクロプロセッサ21に
よって制御されている。通信バス20と認識バス29と
の間のインタフェースは内部バッファメモリ27として
行われる。
【0036】ステップS604において、内部バッファ
メモリ27を介して認識バス29に転送された未知パタ
ーンは、デジタル信号プロセッサ(DSP)30によっ
て特徴抽出装置32に転送される。既知のように、特徴
抽出装置32では、各ベクトル要素がストロークの位
置,方向及び長さなどの未知パターンのさまざまな特徴
を表している特徴ベクトルが求められる。一般に、各未
知パターンごとに200個程度のさまざまな特徴が抽出
される。
【0037】ステップS605において、デジタル信号
プロセッサ30は制御語を大分類装置34の制御レジス
タに書き込み、ソートされた認識候補ではなくソートさ
れた距離値を大分類装置34が出力するように指示する
(すなわち、ビット14を“1”にセットする)。ま
た、ステップS604で求めた特徴ベクトルの一部を、
大分類装置34中のデータRAM44に転送する。さら
に、大分類装置34中で開始ビットをセットし、図4に
おいて述べたように、未知パターンの特徴ベクトルと辞
書ROM35aと35bとに記憶されている特徴ベクト
ルとの比較処理を大分類装置が実行するように指示す
る。
【0038】ステップS606において、大分類装置3
4からのNPO信号を検出すると、デジタル信号プロセ
ッサ30は大分類装置からのソートされた距離値を調べ
る。ここで、大分類装置34からの最適距離値が所定値
より小さければ、すなわち距離値が少なくとも1つの認
識候補が近いことを示していれば、この認識候補の信頼
性は高いと判断する。この場合には、ステップS607
において、大分類処理を再び実行するが、今回はデジタ
ル信号プロセッサ30は制御語を大分類装置34に書き
込み、ソートされた認識候補を装置が出力するように指
示する(すなわち、ビット14を“0”にセットす
る)。ステップS607においてソートされた認識候補
は、内部バッファメモリ27を介して認識バス29から
通信バス20に転送され、さらにバッファメモリ24と
SCSIコントロ−ラ26を介してインタフェース13
でホストCPU10に転送される。
【0039】ステップS608において、ホストCPU
10は認識候補に対して後処理を施し、未知パターンに
認識結果を割り当てる。すなわち、後処理では、スペル
チェック,構文チェック及び内容チェック(例えば、数
字中の文字、あるいはその逆を認識失敗とみなす)など
を行う。尚、ステップS608の処理の前に、図15の
ステップS1505に示したような詳細分類処理を行う
こともできるが、ステップS606において認識候補の
信頼性が高いことが保証されているため必ずしも必要で
はない。未知パターンの認識結果は文字メモリ15に記
憶され、ディスプレイ16に表示される(ステップS6
09)。
【0040】一方、ステップS606において、ステッ
プS605の大分類処理において求められた最適距離値
が所定値以上であれば、ステップS610においてソー
トされた認識候補を出力する大分類処理を実行する。次
いで、ステップS611において、ソートされた認識候
補に対して詳細分類処理を行い、未知パターンに対する
許容可能な認識候補を求めることを試みる。この詳細分
類処理では、ステップS604で抽出された全ての特徴
ベクトルと詳細辞書ROM36に記憶されている全ての
特徴ベクトルとの比較処理を行う。
【0041】この詳細な処理においては、マハラノビス
距離関数や2乗平均距離関数や絶対値平均距離関数の他
あるいは代わりに、擬似ベイズ(pseudo-boyesian) 識別
関数などの他の識別関数を用いることができる。擬似ベ
イズ識別関数法では、距離を計算する際に、特徴ベクト
ルの最初のK個の要素を用いる。次いで、残りの要素の
平均値をhと仮定して、残りの要素の代わりにhを用い
て距離を計算する。このような手法によれば、多数の特
徴ベクトルの距離計算を短い時間で行うことができる。
さらに、ステップS610において大分類を行っている
ため、詳細辞書ROM36中のすべての要素に対して距
離関数を計算する必要はなく、大分類ステップS610
において求められた認識候補のみに対して計算すれば良
い。
【0042】ステップS612では、詳細分類処理にお
いて求めた距離値を調べて、許容可能な認識候補が得ら
れたかどうかを判断する。最適認識候補の距離値が所定
距離より小さければ、認識候補は許容可能であると判断
され、処理をステップS608とステップS609に進
めて、上述のように後処理と表示処理とを行う。一方、
最適認識候補の距離値が所定距離以上であれば、認識候
補は許容可能であるとは言えず、最適認識候補であって
も信頼性指標は低い。この場合には、処理をステップS
613に進め、低信頼性指標をセットする。この指標
は、未知パターンに対する最適認識候補であっても、信
頼性には疑問があることを意味する。ステップS611
やS609で実行される詳細分類処理や後処理は必要で
はない。そこで、大分類処理S610において判断され
た最適認識候補を単にホストCPU10に転送して、文
字メモリ15に低信頼性指標とともに最適認識候補を記
憶し、反転表示などの低信頼性指標とともに最適認識候
補をディスプレイ16上に表示する(ステップS61
4)。
【0043】ステップS615では、認識結果が得られ
ていない未知パターンがあるかどうかを調べる。パター
ンがほかにあればステップS603に処理を戻し、パタ
ーンがほかになければ処理を終了する。
【0044】図7は、図1,図2,図3に示したパター
ン認識装置の第2の動作モードを示すフローチャートで
あり、ここでは未知パターンの認識候補に対して信頼度
が求められる。図7において、ステップS701,S7
02,S703、,704は、それぞれステップS60
1,S602,S603,S604に対応する。
【0045】ステップS705において、ソート部41
のソートメモリは、未知パターンの認識候補に対する許
容信頼度に対応した所定のしきい値に初期化される。ソ
ートメモリをこのしきい値に初期化することで、ソート
メモリは距離値が所定値以上である辞書ROM35aと
35b中の認識候補を自動的に無視する。適切にDSP
30をプログラミングすることで、ソートメモリにしき
い値をセットすることができる。また、大分類装置34
において、未知パターンの特徴ベクトルを処理するより
も前に、はじめに「ダミー」の特徴ベクトルデータを処
理することで、しきい値をソートメモリにセットするこ
ともできる。すなわち、「ダミー」特徴ベクトルデータ
は、辞書特徴ベクトルから既知の距離値を有するように
予め選択されたものであり、ソートメモリには大分類装
置の処理中に自動的にこの既知の距離値が記憶される。
未知パターンの特徴ベクトルの処理は「ダミー」の特徴
ベクトルの後に、またソートメモリを再初期化せずに行
われ、ソートメモリには効率良くしきい値がセットされ
ている。
【0046】ステップS706において、デジタル信号
プロセッサ30は大分類装置34に制御語を書き込み、
大分類装置34にソートされた距離値ではなくソートさ
れた認識候補を出力するように指示する。次いで、開始
ビットをセットして、大分類装置34において未知パタ
ーンの特徴ベクトルと辞書ROM35aと35b中の特
徴ベクトルとの比較処理を実行する。上述のように、ソ
ートメモリは許容信頼度に対応する所定のしきい値に初
期化されているため、認識候補の中で最小許容信頼度を
満たす候補のみに対してソート処理が行われ、デジタル
信号プロセッサ30に転送される。
【0047】ステップS707では、大分類処理の結果
を調べて、大分類装置34から認識候補が出力されたか
どうかを判断する。認識候補が出力された場合には、こ
の出力された認識候補は最小許容信頼度を満たしている
ことになり、ステップS708で詳細認識処理を、ステ
ップ709で後処理を、ステップ710で記憶と表示処
理を行う。ステップS705においてセットされたしき
い値と出力された認識候補数とによっては、ステップS
708の詳細分類処理は必要ではなく、詳細分類処理を
省略することも可能である。
【0048】一方、ステップ707において、大分類装
置34から認識候補が出力されない場合には、いかなる
認識候補も最小許容信頼度を満たしていないことにな
る。そこで、ステップS711において、認識失敗処理
を行って低信頼性指標をセットする。この際、大分類装
置34中のソートメモリを異なったより大きな値に初期
化して、大分類処理を再び実行し、未知パターンに対し
て少なくとも1つの認識候補を得ることもできる。しか
し、このようにして得られた認識候補の信頼性は低いた
め、単にホストCPU10に「?」のような「不明文
字」を表す記号を出力し、ホストCPU10は不明文字
記号を文字メモリ15に記憶し、ディスプレイ16に表
示するだけの方が好ましい。
【0049】ステップS713では、パターン認識を行
わなければならない他のパターンがあるかどうかを調べ
る。他のパターンがある場合には処理をステップS70
3に戻し、一方他にパターンがない場合には処理を終え
る。図8aと図8bは、図1,図2,図3において示し
たパターン認識装置のさらなる動作モードを説明するた
めのフローチャートである。図8に示す処理では、3つ
の異なる距離計算関数を用いて未知パターンを大分類処
理して得られた認識候補に基づいて、信頼度が計算され
る。すなわち、異なる距離計算関数ごとの最適認識候補
が同一であれば、パターン認識候補の精度の信頼性は高
いと判断される。一方、異なる距離計算関数ごとに異な
る認識候補が得られた場合には、認識候補の信頼性は低
いと判断される。
【0050】図8において、ステップS801,S80
2,S803,S804はそれぞれステップS601,
S602S,603,S604と同一である。ステップ
S805において、デジタル信号プロセッサ30は制御
語のビット7と8をセットしてマハラノビス距離関数を
選択し、ソートされた認識候補をデータRAM44に記
憶するようにビット14をセットする。次いで、開始ビ
ット15をセットし、大分類装置34に未知パターンの
特徴ベクトルと辞書ROM35aと35b中の各特徴ベ
クトルとの比較処理をマハラノビス距離関数を用いて開
始するように指示する。この第1の大分類処理によって
得られたソートされた認識候補は内部バッファメモリ2
7に記憶される。
【0051】ステップS806では、絶対値平均距離関
数を選択するように制御語のビット7と8とをセットす
ること以外はステップS805と同一の第2の大分類処
理を実行する。ここでも再び、大分類装置34において
得られたソートされた認識候補は内部バッファメモリ2
7に記憶される。ステップS807では、2乗平均距離
関数を選択するように制御語のビット7と8とをセット
すること以外は上の2つの処理と同一の第3の大分類処
理を実行する。ここでも再び、大分類装置34において
得られたソートされた認識候補は内部バッファメモリ2
7に記憶される。
【0052】ステップS808において、異なる距離計
算ごとの最適認識候補を比較する。これらの認識候補が
同一であれば、認識候補の精度に関する信頼性は高いと
判断される。したがって、一般には詳細分類処理や後処
理は必要ではなく、ステップS809で最適認識候補は
単に記憶されて表示される。一方、ステップS808で
距離計算ごとに最適認識候補が異なる場合には、ステッ
プS810において最適認識候補を比較してすべてが異
なるかどうかを調べる。最適認識候補がすべて異なる場
合には、パターン認識処理の精度に関する信頼性は低い
と判断され、ステップS811で低信頼性指標をセット
する。次いで、ステップS812において、ホストCP
U10は、1つの距離計算で選択された認識候補を低信
頼性指標とともに文字メモリ15に記憶し、選択された
認識候補をディスプレイ16上に低信頼性指標ととも
に、例えば反転表示して表示する。
【0053】ステップS812において記憶され表示さ
れた認識候補は、異なる距離計算関数から得られた最適
認識候補の中で任意に選択される。しかし、特定の特徴
を有する未知パターンに対しては、1つの距離関数を用
いれば他の距離関数を用いるよりも精度良く認識するこ
とが可能である。
【0054】例えば、絶対値平均距離は、高品質で大き
なフォントサイズの画像に適している。したがって、こ
のような画像に対しては、ステップS812における最
適候補として、絶対値平均距離からの最適候補を選ぶ。
一方、低品質で小さなフォントサイズの画像に対して
は、マハラノビス距離関数と2乗平均距離関数とがより
精度良い結果を与える。したがって、このような画像に
対しては、絶対値平均距離関数から得られた最適認識候
補よりも、マハラノビス距離関数あるいは2乗平均距離
関数どちらかからの最適認識候補を用いるべきである。
【0055】ステップS810に戻り、異なる距離関数
からの最適認識候補がすべて異なるわけではない場合、
すなわちいくつかの最適認識候補が同一である場合に
は、信頼度の高い認識候補が得られるかどうかを調べる
ための処理を更に行う。すなわち、処理をステップS8
13に進め、最適認識候補に対して詳細分類処理を行
う。ステップS814では詳細分類処理において選択さ
れた認識候補に対する信頼度を計算する。この信頼度
は、詳細分類処理において出力される距離値に基づいて
計算される。例えば、距離値が大きい場合には信頼度は
低く、逆に距離値が小さい場合には信頼度が高い。同様
に、ステップS814において上位の認識候補の距離値
を比較することでも信頼度を計算することができる。上
位の認識候補の距離値間の差が小さい場合には信頼度は
低く、逆の場合には信頼度は高い。
【0056】ステップS815においてステップS81
4で計算された信頼度が低い場合には、ステップS81
6において低信頼性指標をセットし、ステップS817
において、CPU10はステップS813における最適
認識候補を低信頼性指標とともに文字メモリ15に記憶
し、最適認識候補をディスプレイ16上に低信頼性指標
とともに、例えば反転表示で表示する。
【0057】一方、ステップS815において、信頼度
が高い場合には、ステップS818においてCPU10
はステップS813における最適認識候補を文字メモリ
15に記憶し、最適認識候補をディスプレイ16上に表
示する。次いで処理をステップS819に進め、パター
ン処理を行わなければなならい他のパターンが存在する
かどうかを調べる。存在する場合には処理をステップS
803に戻し、存在しない場合には処理を終了する。
【0058】図9は、本発明におけるパターン認識装置
のさらなる実施例を示す図である。図9において、上述
の部位と同様の機能を果たす部位に対しては、同一の参
照番号を付してある。図9のパターン認識装置におい
て、ホストCPU10は画像データ入力装置11から画
像データを入力し、画像データを画像メモリ12に記憶
する。画像メモリ中の画像データは、CPU10によっ
て個々の未知のパターンに切り出され、インタフェース
13を介して文字認識装置14に転送される。すると、
文字認識装置14は、図1から図9を用いて上述したよ
うに、特徴抽出処理を行って未知パターンの特徴ベクト
ルを求め、特徴ベクトルに基づいて大分類を行い、大分
類結果に基づいて詳細分類処理を行う。詳細分類処理に
よって求められた認識候補はバス13を介してホストC
PU10に転送され、ホストCPU10は後処理を行っ
て未知パターンに対して認識結果を割り当てる。
【0059】未知パターンの認識結果は、バス51を介
してローカルエリアネットワークバス52に転送され
る。このローカルエリアネットワークバス52には、複
数の独立したコンピュータ53がアクセスでき、コンピ
ュータ53のそれぞれがパターン認識装置のパターン認
識機能を利用することができる。図9に示す実施例の動
作は、これを除いて上述の実施例の動作と同一である。
【0060】図10は、本発明におけるパターン認識装
置のさらなる実施例を示す図である。図10において、
上述の部位と同様の機能と構造を有する部位に対して
は、同一の参照番号を付してある。図10において、ロ
ーカルエリアネットワークバス52には、画像データ入
力装置11、文字認識装置14、複数の独立したコンピ
ュータが接続される。このような構成によれば、各独立
したコンピュータ53は画像データ入力装置11の画像
データ入力機能にアクセスでき、このように入力した画
像データを文字認識装置14に転送して未知パターンの
認識結果を得ることができる。また、この構成によれ
ば、ホストCPUや画像メモリを備える必要がない。上
述の実施例においてホストCPU10や画像メモリ12
が行う処理は、独立のコンピュータ53において実行す
ることができるためである。
【0061】図11と図12とは、入力装置11から入
力された画像データが、文字から成る画像データと画像
から成る画像データとを含む場合の、上述の実施例の動
作を説明する図である。すなわち、図11の(a)に示
すように、一般に画像データには、文字やテキストデー
タの画像から成る領域61と、グラフ,絵,チャートな
ど文字でない画像データから成る領域62とが含まれ
る。このような画像においては、文字領域61と非文字
領域62とを区別して、文字領域61に対して文字認識
を行い、図11の(b)に示すように、入力画像中の文
字領域は復号した文字の認識結果で表現し、画像領域は
そのまま画像情報として表現して記憶すると便利であ
る。
【0062】図12は、図11のような動作モードを示
すフローチャートである。ステップS1201におい
て、画像データが入力される。次いで、画像データを調
べて各ブロック情報を明らかにし、各ブロック情報を文
字情報を含むブロックと非文字情報を含むブロックとに
識別する(ステップS1202)。ここでの識別処理と
しては、例えば米国特許4,701,807や4,72
9,035などに記されている手法を用いることができ
る。
【0063】ステップS1203では、ステップS13
02において文字ブロックと識別されたかどうかを判断
する。文字ブロックでない場合には、ステップS120
4において画像データを処理せずに記憶する。一方、文
字ブロックである場合には、ステップS1205におい
て上述の手法のうちの一つを用いて文字認識処理を行
う。そして、ステップS1206において、文字の認識
結果が記憶される。
【0064】ステップS1207では、画像あるいは文
字どちらかの記憶したデータが出力される。この際、記
憶したデータを、モデムを介して電話インタフェースに
出力することもできる。この場合には、文字データはA
SCIIコードなどの符号形式で出力され、画像データ
はCCITTのG3ファクシミリ標準符号化方式などの
画像形式で出力される。
【0065】図13と図14とは、本発明のさらなる実
施例を説明する図であり、この実施例ではワ−ド処理さ
れたテキストの文字認識結果を再確認することができ
る。再確認処理を行うことで、ワード処理されたテキス
トの画像から、パターン認識処理によって元のワード処
理されたテキストファイルを復元できることが保証され
る。すなわち、例えば、ワード処理されたテキストをフ
ァクシミリで離れた地点に送信する場合(例えば、「P
C−fax」でワード処理装置から直接送信する場合)
には、再確認処理を行うことで、離れた地点で受信した
画像に対して文字認識処理を行った結果が元のワード処
理されたテキストファイルであることが保証される。
【0066】図13において、テキストファイル70は
プリント部71でプリントアウトされ、ファクシミリ送
信部72でファクシミリ送信される。ここで「PC−f
ax」を用いる場合にはプリントアウトは行わず、点線
で示されているように、テキストファイルは画像変換部
76で出力画像に変換されファクシミリ送信部72でフ
ァクシミリ送信される。ファクシミリ受信部73で受信
した画像に対して文字認識部74で文字認識を行い、テ
キストファイル75を生成する。なお、文字認識部74
は上述のパターン認識システムのいずれかの手法を用い
て行うことができる。
【0067】テキストファイル75にテキストファイル
70と同一の情報が含まれることを保証するためには、
画像変換,送信及びパターン認識の処理結果を再確認す
る必要がある。そこで、テキストファイル70に対して
画像変換部76で電子的な画像変換処理を行う。ここで
生成された画像は、プリント部71で用いられる様々な
フォントやサイズを模擬したものである。画像変換部7
6で変換された画像に対して、文字認識部77で文字認
識処理を施し、テキストファイル78を生成する。
【0068】表示部79に元のテキストファイル70が
表示され、表示部80にパターン認識されたテキストフ
ァイル78が表示される。ここで、表示は、ディスプレ
イ上のデータ表示例を示す図14のように、それぞれ隣
合うように行われる。そこで、2つのテキストファイル
の比較を行い、2つのテキストファイル間での差異を求
める。参照番号90で反転文字で示されるように、2つ
のファイル間での差異が存在する場合は、71,72,
73,74及び75で送信処理を行うときに元のテキス
トファイルを復元できないことを意味する。したがっ
て、テキストファイル78がテキストファイル70と同
一になるまで、テキストファイルへの修正処理、あるい
はテキストファイルを異なるフォント,スタイル,サイ
ズなどでプリントアウトする処理などを行う。このよう
な修正処理を行うことで、ファクシミリ送信後の文字認
識処理を行ってもテキストファイル70と同一のテキス
トファイル78が得られることが保証される。
【0069】
【発明の効果】本発明により、未知パターンを高信頼度
で認識できていない場合を検出できる。さらに、未知パ
ターンを高信頼度で認識できないという指標を求めるこ
とにより、未知パターンの最適認識候補であっても精度
には疑問が残るような場合に、未知パターンの認識精度
が低いことを示すことができる。
【図面の簡単な説明】
【図1】本実施例のパターン認識装置の全体ブロック図
である。
【図2】図1中の光学文字認識装置の詳細なブロック図
である。
【図3】図2中の大分類装置の詳細なブロック図であ
る。
【図4】図3の大分類装置の動作の流れを示すフローチ
ャートである。
【図5】図3の大分類装置で用いる制御語を説明する図
である。
【図6】本実施例の認識失敗処理の流れを説明するフロ
ーチャートである。
【図7】本実施例の認識失敗処理の流れを説明するフロ
ーチャートである。
【図8a】本実施例の認識失敗処理の流れを説明するフ
ローチャートである。
【図8b】本実施例の認識失敗処理の流れを説明するフ
ローチャートである。
【図9】本発明におけるパターン認識装置の他の実施例
を示すブロック図である。
【図10】本発明におけるパターン認識装置の他の実施
例を示すブロック図である。
【図11】本実施例のパターン認識の例を説明するため
の図である。
【図12】図11のパターン認識処理の流れを説明する
ためのフローチャートである。
【図13】本発明における他のパターン認識システムを
説明する機能ブロック図である。
【図14】図13のシステムにおけるパターン認識結果
を示す図である。
【図15】既知のパターン認識処理の流れを説明するた
めのフローチャートである。

Claims (72)

    【特許請求の範囲】
  1. 【請求項1】 未知パターンに対する認識候補を求める
    パターン認識手段と、 認識候補の信頼度を決定する信頼度決定手段と、 認識候補の信頼度が所定値より高い場合に認識候補を出
    力し、信頼度が所定値より低い場合には認識失敗信号を
    出力する処理手段とを備えることを特徴とするパターン
    認識装置。
  2. 【請求項2】 前記パターン認識手段は、未知パターン
    と少なくとも1つの既知パターンとの間の距離値を計算
    する分類手段を備えることを特徴とする請求項1記載の
    パターン認識装置。
  3. 【請求項3】 前記信頼度決定手段は、前記分類手段か
    らの距離値に基づいて信頼度を決定することを特徴とす
    る請求項2記載のパターン認識装置。
  4. 【請求項4】 前記分類手段は、未知パターンと少なく
    とも1つの既知パターンとの間のソートされた距離値
    と、未知パターンに対するソートされた認識候補とを、
    選択的に出力することを特徴とする請求項3記載のパタ
    ーン認識装置。
  5. 【請求項5】 前記分類手段は複数の距離関数に基づい
    て未知パターンと少なくとも1つの既知パターンとの間
    の距離値を出力し、前記信頼度決定手段は複数の距離関
    数から出力された距離値を比較することで信頼度を決定
    することを特徴とする請求項2記載のパターン認識装
    置。
  6. 【請求項6】 前記パターン認識手段は、認識候補が所
    定レベルよりも既知パターンに近い場合に、認識候補を
    出力する分類手段を備えることを特徴とする請求項1記
    載のパターン認識装置。
  7. 【請求項7】 前記パターン認識手段は複数の認識候補
    を出力し、前記処理手段は複数の認識候補を処理するた
    めの詳細処理手段を備えることを特徴とする請求項1記
    載のパターン認識装置。
  8. 【請求項8】 前記詳細処理手段は、信頼度に基づいて
    選択的に詳細処理を実行することを特徴とする請求項7
    記載のパターン認識装置。
  9. 【請求項9】 前記未知パターンは文字パターンである
    ことを特徴とする請求項1記載のパターン認識装置。
  10. 【請求項10】 文字パターンと非文字パターンとを識
    別する識別手段をさらに備え、文字パターンが識別され
    た場合には前記パターン認識手段が認識候補を出力する
    ことを特徴とする請求項9記載のパターン認識装置。
  11. 【請求項11】 前記処理手段は文字情報処理手段を備
    え、該文字情報処理手段において処理された文字情報を
    前記パターン認識手段によって処理させるための再確認
    手段とをさらに備えることを特徴とする請求項9記載の
    パターン認識装置。
  12. 【請求項12】 画像情報からパターンを切り出すホス
    トと、 該ホストから転送されたパターンに対する認識候補を出
    力し、認識候補の信頼度を決定する信頼度決定手段を有
    するパターン認識手段とを備え、 該ホストは、認識候補の信頼度が所定値より高い場合に
    認識候補を出力し、信頼度が所定値より低い場合には認
    識失敗信号を出力することを特徴とするパターン認識装
    置。
  13. 【請求項13】 前記画像情報をホストに入力するため
    の画像情報入力手段をさらに備えることを特徴とする請
    求項12記載のパターン認識装置。
  14. 【請求項14】 前記ホストが接続されるネットワーク
    バスをさらに備え、前記ホストはパターン認識のための
    該ネットワークバス上の命令に対して応答することを特
    徴とする請求項12記載のパターン認識装置。
  15. 【請求項15】 前記パターン認識手段は、未知パター
    ンと少なくとも1つの既知パターンとの間の距離値を計
    算する分類手段を備えることを特徴とする請求項12記
    載のパターン認識装置。
  16. 【請求項16】 前記信頼度決定手段は、前記分類手段
    からの距離値に基づいて信頼度を決定することを特徴と
    する請求項15記載のパターン認識装置。
  17. 【請求項17】 前記分類手段は、未知パターンと少な
    くとも1つの既知パターンとの間のソートされた距離値
    と、未知パターンに対するソートされた認識候補とを、
    選択的に出力することを特徴とする請求項16記載のパ
    ターン認識装置。
  18. 【請求項18】 前記分類手段は複数の距離関数に基づ
    いて未知パターンと少なくとも1つの既知パターンとの
    間の距離値を出力し、前記信頼度決定手段は複数の距離
    関数から出力された距離値を比較することで信頼度を決
    定することをとする請求項16記載のパターン認識装
    置。
  19. 【請求項19】 前記パターン認識手段は、認識候補が
    所定レベルよりも既知パターンに近い場合に、認識候補
    を出力する分類手段を備えることを特徴とする請求項1
    2記載のパターン認識装置。
  20. 【請求項20】 前記パターン認識手段は複数の認識候
    補を出力し、前記ホストは複数の認識候補を処理するた
    めの詳細処理手段を備えることを特徴とする請求項12
    記載のパターン認識装置。
  21. 【請求項21】 前記詳細処理手段は、信頼度に基づい
    て選択的に詳細処理を実行することを特徴とする請求項
    20記載のパターン認識装置。
  22. 【請求項22】 前記未知パターンは文字パターンであ
    ることを特徴とする請求項12記載のパターン認識装
    置。
  23. 【請求項23】 文字パターンと非文字パターンとを識
    別する識別手段をさらに備え、文字パターンが識別され
    た場合には前記パターン認識手段が認識候補を出力する
    ことを特徴とする請求項22記載のパターン認識装置。
  24. 【請求項24】 前記ホストは文字情報処理手段を備
    え、該文字情報処理手段において処理された文字情報を
    前記パターン認識手段によって処理させるための再確認
    手段とをさらに備えることを特徴とする請求項22記載
    のパターン認識装置。
  25. 【請求項25】 ネットワークバスと、 該ネットワークバスに接続され、画像情報を入力するた
    めの画像入力手段と、 該ネットワークバスに接続され、未知パターンに対する
    認識候補を求め、認識候補の信頼度を決定する信頼度決
    定手段を有するパターン認識手段と、 該ネットワークバスに接続された複数の処理手段であっ
    て、各該処理手段は、前記画像入力装置から入力された
    画像情報からパターンを切り出し、パターンを前記パタ
    ーン認識手段に入力し、前記パターン認識手段から認識
    候補と信頼度とを受信する複数の処理手段とを備えるこ
    とを特徴とするパターン認識装置。
  26. 【請求項26】 前記処理手段の各々は、認識候補の信
    頼度が所定値より高い場合に認識候補を出力し、信頼度
    が所定値より低い場合には認識失敗信号を出力すること
    を特徴とする請求項25記載のパターン認識装置。
  27. 【請求項27】 前記パターン認識手段は、未知パター
    ンと少なくとも1つの既知パターンとの間の距離値を計
    算する分類手段を備えることを特徴とする請求項25記
    載のパターン認識装置。
  28. 【請求項28】 前記信頼度決定手段は、前記分類手段
    からの距離値に基づいて信頼度を決定することを特徴と
    する請求項27記載のパターン認識装置。
  29. 【請求項29】 前記分類手段は、未知パターンと少な
    くとも1つの既知パターンとの間のソートされた距離値
    と、未知パターンに対するソートされた認識候補とを、
    選択的に出力することを特徴とする請求項28記載のパ
    ターン認識装置。
  30. 【請求項30】 前記分類手段は複数の距離関数に基づ
    いて未知パターンと少なくとも1つの既知パターンとの
    間の距離値を出力し、前記信頼度決定手段は複数の距離
    関数から出力された距離値を比較することで信頼度を決
    定することをとする請求項27記載のパターン認識装
    置。
  31. 【請求項31】 前記パターン認識手段は、認識候補が
    所定レベルよりも既知パターンに近い場合に、認識候補
    を出力する分類手段を備えることを特徴とする請求項2
    5記載のパターン認識装置。
  32. 【請求項32】 前記パターン認識手段は複数の認識候
    補を出力し、前記複数の処理手段の各々は複数の認識候
    補を処理するための詳細処理手段を備えることを特徴と
    する請求項25記載のパターン認識装置。
  33. 【請求項33】 前記詳細処理手段は、信頼度に基づい
    て選択的に詳細処理を実行することを特徴とする請求項
    32記載のパターン認識装置。
  34. 【請求項34】 前記未知パターンは文字パターンであ
    ることを特徴とする請求項25記載のパターン認識装
    置。
  35. 【請求項35】 文字パターンと非文字パターンとを識
    別する識別手段をさらに備え、文字パターンが識別され
    た場合には前記パターン認識手段が認識候補を出力する
    ことを特徴とする請求項34記載のパターン認識装置。
  36. 【請求項36】 前記複数の処理手段の各々は文字情報
    処理手段を備え、該文字情報処理手段において処理され
    た文字情報を前記パターン認識手段によって処理させる
    ための再確認手段とをさらに備えることを特徴とする請
    求項34記載のパターン認識装置。
  37. 【請求項37】 未知パターンに対する認識候補を出力
    する行程と、 認識候補の信頼度を計算する行程と、 高信頼度の場合に認識候補を出力し、低信頼度の場合に
    認識失敗信号を出力する行程とを備えることを特徴とす
    るパターン認識方法。
  38. 【請求項38】 前記認識候補の出力行程では、未知パ
    ターンと少なくとも1つの既知パターンとの間の距離値
    を計算することを特徴とする請求項37記載のパターン
    認識方法。
  39. 【請求項39】 前記信頼度の計算行程では、距離値に
    基づいて信頼度を計算することを特徴とする請求項38
    記載のパターン認識方法。
  40. 【請求項40】 前記出力行程では、未知パターンと少
    なくとも1つの既知パターンとの間のソートされた距離
    値と、未知パターンのソートされた認識候補とを、選択
    的に出力することを特徴とする請求項39記載のパター
    ン認識方法。
  41. 【請求項41】 前記出力行程では、未知パターンと少
    なくとも1つの既知パターンとの間の距離値を複数の距
    離関数に基づいて計算し、前記信頼度の計算行程では、
    複数の計算関数に基づく距離値を比較することで信頼度
    を計算することを特徴とする請求項38記載のパターン
    認識方法。
  42. 【請求項42】 前記認識候補の出力行程では、認識候
    補と既知パターンとの距離が所定レベル以下である場合
    に認識候補を出力することを特徴とする請求項37記載
    のパターン認識方法。
  43. 【請求項43】 前記出力行程では複数の認識候補を出
    力し、さらに該複数の認識候補を詳細に分類する行程を
    備えることを特徴とする請求項37記載のパターン認識
    方法。
  44. 【請求項44】 前記詳細分類行程では、信頼度に基づ
    いて選択的に実行されることを特徴とする請求項43記
    載のパターン認識方法。
  45. 【請求項45】 前記未知パターンは文字パターンであ
    ることを特徴とする請求項37記載のパターン認識方
    法。
  46. 【請求項46】 文字パターンと非文字パターンとを識
    別する識別行程をさらに備え、文字パターンが識別され
    た場合に前記出力行程では認識候補を出力することを特
    徴とする請求項45記載のパターン認識装置。
  47. 【請求項47】 文字情報の処理行程と、該文字情報の
    処理行程で処理された文字情報を再確認する行程をさら
    に備えることを特徴とする請求項45記載のパターン認
    識方法。
  48. 【請求項48】 画像情報からパターンを切り出す行程
    と、 パターンに対する認識候補を出力する行程と、 認識候補の信頼度を計算する行程と、 高信頼度の場合に認識候補を出力し、低信頼度の場合に
    認識失敗信号を出力する行程とを備えることを特徴とす
    るパターン認識方法。
  49. 【請求項49】 前記画像情報をホストに入力する行程
    をさらに備えることを特徴とする請求項48記載のパタ
    ーン認識方法。
  50. 【請求項50】 前記ホストをネットワークバスに接続
    する行程をさらに備え、前記ホストはパターン認識のた
    めの該ネットワークバス上の命令に対して応答すること
    を特徴とする請求項48記載のパターン認識方法。
  51. 【請求項51】 前記認識候補の出力行程では、未知パ
    ターンと少なくとも1つの既知パターンとの間の距離値
    を計算することを特徴とする請求項48記載のパターン
    認識方法。
  52. 【請求項52】 前記信頼度の計算行程では、距離値に
    基づいて信頼度を計算することを特徴とする請求項51
    記載のパターン認識方法。
  53. 【請求項53】 前記出力行程では、未知パターンと少
    なくとも1つの既知パターンとの間のソートされた距離
    値と、未知パターンのソートされた認識候補とを、選択
    的に出力することを特徴とする請求項52記載のパター
    ン認識方法。
  54. 【請求項54】 前記出力行程では、未知パターンと少
    なくとも1つの既知パターンとの間の距離値を複数の距
    離関数に基づいて計算し、前記信頼度の計算行程では、
    複数の計算関数に基づく距離値を比較することで信頼度
    を計算することを特徴とする請求項51記載のパターン
    認識方法。
  55. 【請求項55】 前記認識候補の出力行程では、認識候
    補と既知パターンとの距離が所定レベル以下である場合
    に認識候補を出力することを特徴とする請求項48記載
    のパターン認識方法。
  56. 【請求項56】 前記認識候補の出力行程では複数の認
    識候補を出力し、さらに該複数の認識候補を詳細に分類
    する行程を備えることを特徴とする請求項48記載のパ
    ターン認識方法。
  57. 【請求項57】 前記詳細分類の行程では、信頼度に基
    づいて選択的に実行されることを特徴とする請求項56
    記載のパターン認識方法。
  58. 【請求項58】 前記未知パターンは文字パターンであ
    ることを特徴とする請求項56記載のパターン認識方
    法。
  59. 【請求項59】 文字パターンと非文字パターンとを識
    別する識別行程をさらに備え、文字パターンが識別され
    た場合に前記認識候補の出力行程で認識候補を出力する
    ことを特徴とする請求項58記載のパターン認識方法。
  60. 【請求項60】 文字情報の処理行程と、該文字情報の
    処理行程で処理された文字情報を再確認する行程をさら
    に備えることを特徴とする請求項58記載のパターン認
    識方法。
  61. 【請求項61】 ネットワークバスに接続された画像入
    力手段から画像情報を入力する行程と、 前記画像情報からパターンを切り出す行程と、 前記パターンごとに認識候補を出力する行程と、 各認識候補の信頼度を計算する行程と、 各パターンに対する認識候補と信頼度とをネットワーク
    バス上に転送する行程とを備えることを特徴とするパタ
    ーン認識方法。
  62. 【請求項62】 ネットワーク上に転送された認識候補
    を処理し、高信頼度の場合に各パターンに対する認識候
    補を出力し、低信頼度の場合に認識失敗信号を出力する
    行程をさらに備えることを特徴とする請求項61記載の
    パターン認識方法。
  63. 【請求項63】 前記認識候補の出力行程は、パターン
    と少なくとも1つの既知パターンとの間の距離値を計算
    することを特徴とする請求項61記載のパターン認識方
    法。
  64. 【請求項64】 前記信頼度の計算行程では、距離値に
    基づいて信頼度を計算することを特徴とする請求項63
    記載のパターン認識方法。
  65. 【請求項65】 前記出力行程では、未知パターンと少
    なくとも1つの既知パターンとの間のソートされた距離
    値と、未知パターンのソートされた認識候補とを、選択
    的に出力することを特徴とする請求項64記載のパター
    ン認識方法。
  66. 【請求項66】 前記出力行程では、パターンと少なく
    とも1つの既知パターンとの間の距離値を複数の距離関
    数に基づいて計算し、前記信頼度の計算行程では、複数
    の計算関数に基づく距離値を比較することで信頼度を計
    算することを特徴とする請求項63記載のパターン認識
    方法。
  67. 【請求項67】 前記認識候補の出力行程では、認識候
    補と既知パターンとの距離が所定レベル以下である場合
    に認識候補を出力することを特徴とする請求項61記載
    のパターン認識方法。
  68. 【請求項68】 前記認識候補の出力行程では複数の認
    識候補を出力し、さらに少なくとも高信頼度である場合
    には該複数の認識候補を詳細に分類する行程を備えるこ
    とを特徴とする請求項61記載のパターン認識方法。
  69. 【請求項69】 前記詳細分類の行程では、信頼度に基
    づいて選択的に実行されることを特徴とする請求項68
    記載のパターン認識方法。
  70. 【請求項70】 前記未知パターンは文字パターンであ
    ることを特徴とする請求項61記載のパターン認識方
    法。
  71. 【請求項71】 文字パターンと非文字パターンとを識
    別する識別行程をさらに備え、文字パターンが識別され
    た場合に前記認識候補の出力行程で認識候補を出力する
    ことを特徴とする請求項70記載のパターン認識方法。
  72. 【請求項72】 文字情報の処理行程と、該文字情報の
    処理行程で処理された文字情報を再確認する行程をさら
    に備えることを特徴とする請求項70記載のパターン認
    識方法。
JP5020334A 1992-02-07 1993-02-08 パターン認識方法及び装置 Withdrawn JPH05274436A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US83259492A 1992-02-07 1992-02-07
US832594 1992-02-07

Publications (1)

Publication Number Publication Date
JPH05274436A true JPH05274436A (ja) 1993-10-22

Family

ID=25262125

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5020334A Withdrawn JPH05274436A (ja) 1992-02-07 1993-02-08 パターン認識方法及び装置

Country Status (4)

Country Link
US (1) US5524065A (ja)
EP (1) EP0555024B1 (ja)
JP (1) JPH05274436A (ja)
DE (1) DE69328640T2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009013818A1 (ja) * 2007-07-25 2009-01-29 Fujitsu Limited 文字認識処理方法及び装置

Families Citing this family (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10361802B1 (en) 1999-02-01 2019-07-23 Blanding Hovenweep, Llc Adaptive pattern recognition based control system and method
US6400996B1 (en) 1999-02-01 2002-06-04 Steven M. Hoffberg Adaptive pattern recognition based control system and method
US6850252B1 (en) 1999-10-05 2005-02-01 Steven M. Hoffberg Intelligent electronic appliance system and method
US5903454A (en) 1991-12-23 1999-05-11 Hoffberg; Linda Irene Human-factored interface corporating adaptive pattern recognition based controller apparatus
US6418424B1 (en) 1991-12-23 2002-07-09 Steven M. Hoffberg Ergonomic man-machine interface incorporating adaptive pattern recognition based control system
US8352400B2 (en) 1991-12-23 2013-01-08 Hoffberg Steven M Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore
US7721307B2 (en) 1992-12-09 2010-05-18 Comcast Ip Holdings I, Llc Method and apparatus for targeting of interactive virtual objects
JPH087033A (ja) * 1994-06-16 1996-01-12 Canon Inc 情報処理方法及び装置
TW274135B (ja) * 1994-09-14 1996-04-11 Hitachi Seisakusyo Kk
US5463564A (en) 1994-09-16 1995-10-31 3-Dimensional Pharmaceuticals, Inc. System and method of automatically generating chemical compounds with desired properties
US5666547A (en) * 1994-09-23 1997-09-09 Alcatel Network Systems, Inc. Method and apparatus for framing a serial data stream
US5649070A (en) * 1995-02-17 1997-07-15 International Business Machines Corporation Learning system with prototype replacement
US5739518A (en) * 1995-05-17 1998-04-14 Metanetics Corporation Autodiscrimination for dataform decoding and standardized recording
US5912700A (en) * 1996-01-10 1999-06-15 Fox Sports Productions, Inc. System for enhancing the television presentation of an object at a sporting event
US6104833A (en) * 1996-01-09 2000-08-15 Fujitsu Limited Pattern recognizing apparatus and method
JP2973944B2 (ja) * 1996-06-26 1999-11-08 富士ゼロックス株式会社 文書処理装置および文書処理方法
US6535681B2 (en) * 2001-06-19 2003-03-18 Lucent Technologies Inc. Fiber-optic cable routing and bend limiting device and system
US5917553A (en) * 1996-10-22 1999-06-29 Fox Sports Productions Inc. Method and apparatus for enhancing the broadcast of a live event
US6453246B1 (en) * 1996-11-04 2002-09-17 3-Dimensional Pharmaceuticals, Inc. System, method, and computer program product for representing proximity data in a multi-dimensional space
IL129498A0 (en) 1996-11-04 2000-02-29 Dimensional Pharm Inc System method and computer program product for identifying chemical compounds having desired properties
US6571227B1 (en) * 1996-11-04 2003-05-27 3-Dimensional Pharmaceuticals, Inc. Method, system and computer program product for non-linear mapping of multi-dimensional data
US5953077A (en) * 1997-01-17 1999-09-14 Fox Sports Productions, Inc. System for displaying an object that is not visible to a camera
US6370269B1 (en) * 1997-01-21 2002-04-09 International Business Machines Corporation Optical character recognition of handwritten or cursive text in multiple languages
US5930393A (en) * 1997-08-11 1999-07-27 Lucent Technologies Inc. Method and apparatus for enhancing degraded document images
US7152031B1 (en) * 2000-02-25 2006-12-19 Novell, Inc. Construction, manipulation, and comparison of a multi-dimensional semantic space
US7904187B2 (en) 1999-02-01 2011-03-08 Hoffberg Steven M Internet appliance system and method
US6459809B1 (en) 1999-07-12 2002-10-01 Novell, Inc. Searching and filtering content streams using contour transformations
US6594382B1 (en) * 1999-11-04 2003-07-15 The United States Of America As Represented By The Secretary Of The Navy Neural sensors
US6671627B2 (en) 2000-02-29 2003-12-30 3-D Pharmaceuticals, Inc. Method and computer program product for designing combinatorial arrays
WO2001071624A1 (en) 2000-03-22 2001-09-27 3-Dimensional Pharmaceuticals, Inc. System, method, and computer program product for representing object relationships in a multidimensional space
AU2001249805A1 (en) 2000-04-03 2001-10-15 3-Dimensional Pharmaceuticals, Inc. Method, system, and computer program product for representing object relationships in a multidimensional space
US7653530B2 (en) * 2000-07-13 2010-01-26 Novell, Inc. Method and mechanism for the creation, maintenance, and comparison of semantic abstracts
US7286977B1 (en) 2000-09-05 2007-10-23 Novell, Inc. Intentional-stance characterization of a general content stream or repository
US7672952B2 (en) * 2000-07-13 2010-03-02 Novell, Inc. System and method of semantic correlation of rich content
US6834239B2 (en) * 2000-08-22 2004-12-21 Victor S. Lobanov Method, system, and computer program product for determining properties of combinatorial library products from features of library building blocks
US20100122312A1 (en) * 2008-11-07 2010-05-13 Novell, Inc. Predictive service systems
US20090234718A1 (en) * 2000-09-05 2009-09-17 Novell, Inc. Predictive service systems using emotion detection
AU2001292740A1 (en) * 2000-09-20 2002-04-02 Dimitris K. Agrafiotis Method, system, and computer program product for encoding and building products of a virtual combinatorial library
US8682077B1 (en) 2000-11-28 2014-03-25 Hand Held Products, Inc. Method for omnidirectional processing of 2D images including recognizable characters
WO2002061419A1 (en) * 2001-01-29 2002-08-08 3-Dimensional Pharmaceuticals, Inc. Method, system, and computer program product for analyzing combinatorial libraries
JP4421134B2 (ja) * 2001-04-18 2010-02-24 富士通株式会社 文書画像検索装置
US6768815B2 (en) 2001-05-10 2004-07-27 The United States Of America As Represented By The Secretary Of The Navy Color sensor
JP4846924B2 (ja) * 2001-05-31 2011-12-28 キヤノン株式会社 パターン認識装置
US7020336B2 (en) * 2001-11-13 2006-03-28 Koninklijke Philips Electronics N.V. Identification and evaluation of audience exposure to logos in a broadcast event
US7167587B2 (en) * 2002-08-30 2007-01-23 Lockheed Martin Corporation Sequential classifier for use in pattern recognition system
US7366352B2 (en) * 2003-03-20 2008-04-29 International Business Machines Corporation Method and apparatus for performing fast closest match in pattern recognition
US8620083B2 (en) * 2004-12-03 2013-12-31 Google Inc. Method and system for character recognition
JP2005339039A (ja) * 2004-05-25 2005-12-08 Fuji Xerox Co Ltd 文書処理装置および文書処理方法
US7416125B2 (en) * 2005-03-24 2008-08-26 Hand Held Products, Inc. Synthesis decoding and methods of use thereof
JP5361174B2 (ja) * 2007-11-30 2013-12-04 キヤノン株式会社 表示制御装置、表示制御方法、およびプログラム
US10007486B2 (en) * 2008-12-01 2018-06-26 Micron Technology, Inc. Systems and methods to enable identification of different data sets
US8296297B2 (en) * 2008-12-30 2012-10-23 Novell, Inc. Content analysis and correlation
US8301622B2 (en) * 2008-12-30 2012-10-30 Novell, Inc. Identity analysis and correlation
US8386475B2 (en) * 2008-12-30 2013-02-26 Novell, Inc. Attribution analysis and correlation
US8150160B2 (en) * 2009-03-26 2012-04-03 King Fahd University Of Petroleum & Minerals Automatic Arabic text image optical character recognition method
US20100250479A1 (en) * 2009-03-31 2010-09-30 Novell, Inc. Intellectual property discovery and mapping systems and methods
US11636203B2 (en) 2020-06-22 2023-04-25 Bank Of America Corporation System for isolated access and analysis of suspicious code in a disposable computing environment
US11880461B2 (en) 2020-06-22 2024-01-23 Bank Of America Corporation Application interface based system for isolated access and analysis of suspicious code in a computing environment
US11269991B2 (en) 2020-06-22 2022-03-08 Bank Of America Corporation System for identifying suspicious code in an isolated computing environment based on code characteristics
US11797669B2 (en) 2020-06-22 2023-10-24 Bank Of America Corporation System for isolated access and analysis of suspicious code in a computing environment
US11574056B2 (en) 2020-06-26 2023-02-07 Bank Of America Corporation System for identifying suspicious code embedded in a file in an isolated computing environment

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE1811420B2 (de) * 1968-11-28 1974-05-30 Matth. Hohner Ag, 7218 Trossingen Schaltung zur Klassifizierung von Repräsentanten mit stark unterschiedlichen Merkmalen
DE3026055C2 (de) * 1980-07-09 1984-01-12 Computer Gesellschaft Konstanz Mbh, 7750 Konstanz Schaltungsanordnung zur maschinellen Zeichererkennung
JPS57178578A (en) * 1981-04-27 1982-11-02 Toshiba Corp Pattern recognition system
JPS5879300A (ja) * 1981-11-06 1983-05-13 日本電気株式会社 パタ−ン距離計算方式
US4573196A (en) * 1983-01-19 1986-02-25 Communications Intelligence Corporation Confusion grouping of strokes in pattern recognition method and system
US4621334A (en) * 1983-08-26 1986-11-04 Electronic Signature Lock Corporation Personal identification apparatus
US4701807A (en) * 1983-09-22 1987-10-20 Canon Kabushiki Kaisha Method and apparatus for processing an image
US4658429A (en) * 1983-12-29 1987-04-14 Hitachi, Ltd. System and method for preparing a recognition dictionary
US5077807A (en) * 1985-10-10 1991-12-31 Palantir Corp. Preprocessing means for use in a pattern classification system
JPS63311583A (ja) * 1987-06-15 1988-12-20 Fuji Xerox Co Ltd 手書き文字認識システム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009013818A1 (ja) * 2007-07-25 2009-01-29 Fujitsu Limited 文字認識処理方法及び装置
JP4935905B2 (ja) * 2007-07-25 2012-05-23 富士通株式会社 文字認識処理方法及び装置
US8254689B2 (en) 2007-07-25 2012-08-28 Fujitsu Limited Character recognition processing method and apparatus

Also Published As

Publication number Publication date
EP0555024A2 (en) 1993-08-11
EP0555024B1 (en) 2000-05-17
US5524065A (en) 1996-06-04
DE69328640D1 (de) 2000-06-21
DE69328640T2 (de) 2000-09-28
EP0555024A3 (ja) 1994-03-09

Similar Documents

Publication Publication Date Title
JPH05274436A (ja) パターン認識方法及び装置
JPH05282452A (ja) パターン認識方法及び装置
EP0355748B1 (en) A pattern recognition apparatus and method for doing the same
JP2741575B2 (ja) 文字認識文字補完方法及びコンピュータ・システム
US5468077A (en) Method and apparatus for combining characters
JP2007317022A (ja) 手書文字処理装置及び手書文字処理方法
US5905811A (en) System for indexing document images
CN113869361A (zh) 模型训练方法、目标检测方法及相关装置
US4799271A (en) Optical character reader apparatus
JP3937687B2 (ja) 画像処理装置及び画像処理方法、記録媒体
US20020057841A1 (en) Data processing method and apparatus
US6016155A (en) Character processing apparatus, character processing method, and memory
JP2000201080A (ja) 付加コ―ドを用いたデ―タ圧縮/復元装置および方法
EP0457547B1 (en) Information recognition apparatus and method
JPH10289226A (ja) 文字処理装置, 文字処理システム, 文字処理方法およびその方法をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
CN113449523B (zh) 异常地址文本的确定方法、装置、电子设备和存储介质
JP3100268B2 (ja) 印刷装置
JP3955410B2 (ja) 類似情報照合装置、類似情報照合方法、及び、類似情報照合プログラムを記録した記録媒体
JPH06223121A (ja) 情報検索装置
US10515297B2 (en) Recognition device, recognition method, and computer program product
CN117370903A (zh) 疾病分类方法、模型训练方法、装置、电子设备、介质
JP3061562B2 (ja) 印刷システム、情報処理装置、情報処理方法、印字装置および印字方法
JP3507387B2 (ja) ホストコンピュータおよびプリンタドライバによる文字印字処理方法
JP3760040B2 (ja) 文字認識方法、文字認識装置及び情報記録媒体
JPH07334611A (ja) 非認識文字の表示方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20000509