JP4631005B2

JP4631005B2 - 付加情報を用いたパターン認識に係るプログラム、装置および方法

Info

Publication number: JP4631005B2
Application number: JP2005207511A
Authority: JP
Inventors: 雅一岩村; 誠一内田; 真一郎大町; 浩一黄瀬
Original assignee: Osaka Prefecture University
Current assignee: Osaka Prefecture University
Priority date: 2005-07-15
Filing date: 2005-07-15
Publication date: 2011-02-16
Anticipated expiration: 2025-07-15
Also published as: JP2007026098A

Description

この発明は、付加情報を用いたパターン認識に係るプログラム、装置および方法に関する。

一般にパターン認識の識別器は、文字画像等に含まれるパターンから抽出された特徴量を基に、そのパターンが属する可能性が高いカテゴリー（クラス）を出力する（図２０（ａ））。パターン認識では正しい認識結果にのみ価値が認められることが多いため、識別器の評価には認識率を用いるのが一般的である。その意味で認識率１００％を実現できる識別器は理想的であるが、その実現は容易でない。

そこで、パターンが属する（正解）クラスの情報（以後、付加情報または符号と呼ぶ。これは後述の記号の集合である。）をパターンとは独立に識別器に与えることで認識性能の改善を図る方式が提案されている。この方式に属する研究として、最近ではアクティブ帳票があり（例えば、非特許文献１参照）、複比を用いた付加情報の埋め込みも検討されている（例えば、非特許文献２、３参照）。

また、Confusion Matrix（混同行列ともいう。以下、ＣＭ）を用いて認識誤りに対処する手法が提案されている。例えば、文書画像からＯＣＲを用いてテキスト情報を抽出し、全文データベースを構築する際にＣＭを用いる方法が提案されている（例えば、非特許文献４参照）。しかし、これは認識後にＣＭを用いる処理であり、ＣＭの情報を認識に反映するものではない．
島村太郎、朱碧蘭、櫻田武嗣、中川正樹、"アクティブ帳票システムの設計と開発" 信学論(D-II), vol.J87-D-II, no.12, pp.2091-2103, Dec.,2004. 内田誠一、岩村雅一、大町真一郎、黄瀬浩一、"カメラによる文字認識のための付加情報の埋め込みに関する検討、" 画像の認識・理解シンポジウム(MIRU2005)論文集、 OS7A-29, July, 2005. 黄瀬浩一、大町真一郎、内田誠一、岩村雅一、カメラを用いた文字認識・文書画像解析の現状と課題、信学技報 PRMU2004-246, Mar.,2005. 太田学、高須淳宏、安達淳、"認識誤りを含む和文テキストにおける全文検索手法" 情報処理学会論文誌、vol.39, no.3, pp.625-635, Mar.,1998.

前述のように、パターン認識の究極の目標は認識率１００％の達成である。しかし、誤認識が全く起こらない識別器の設計は容易ではない。そこで、認識誤りを補うために正解クラスに関する情報（付加情報）をパターンとは別に用意する手法が提案されている。

しかし、与えられた識別器に対してどのような情報を付加すれば認識性能がどの程度向上するのか等、付加情報と認識性能の関係についてはほとんど解明されていない。所定のパターン認識性能を満足するために必要かつ十分な付加情報をパターンと同時に識別器に与えることのできる手法が望まれている。前述の手法が提供できれば、付加情報の情報量によって達成可能な認識率や必要なリジェクト率が決まり、認識率１００％かつリジェクト率０％を達成することも可能になるからである。
また、前記付加情報がパターンと共に与えられたときにパターンを認識できるものが望まれている。

ここで、認識率とは、認識したパターンの中で、正しく認識されたパターンの比率である。認識した全てのパターンについて何らかの認識結果を出力する場合、認識率と相補的な関係にあるのが誤読率である。また、認識したパターンに最もよくマッチングするクラスの得点が所定の値に満たない場合、誤読を避けるために認識の放棄（リジェクト）を行う場合がある。リジェクトは、誤読率を低減するための処理といえる。認識したパターンの中でリジェクトしたパターンの比率をリジェクト率という。

前記の課題に対して、この発明は、パターンのパターン認識結果と各パターンに対応付けられた付加情報とに基づいて複数のカテゴリーから各パターンが属するカテゴリーを決定する認識手法に係る付加情報の決定方法であって、各パターンがパターン認識されたときに真のカテゴリーを含む各カテゴリーに属すると判定されるそれぞれの確率を要素とする混同行列を取得する工程と、目標の認識性能を入力させる工程と、混同行列を参照し、各パターンの真のカテゴリーに対して当該パターンに付加すべき付加情報の符号を対応付けて入力された目標性能を満足するように符号定義を決定する符号定義工程と、符号定義を付加情報として出力する工程とをコンピュータに実行させることを特徴とする付加情報決定方法を提供する。

また、異なる観点から、この発明は、パターンのパターン認識結果と各パターンに対応付けられた付加情報とに基づいて複数のカテゴリーから各パターンが属するカテゴリーを決定する認識手法に係る前記付加情報の決定処理をコンピュータに実行させる付加情報決定プログラムであって、各パターンがパターン認識されたときに真のカテゴリーを含む各カテゴリーに属すると判定されるそれぞれの確率を要素とする混同行列を取得する混同行列取得部と、目標の認識性能を入力させる目標性能入力部と、混同行列を参照し、各パターンの真のカテゴリーに対して当該パターンに付加すべき付加情報の符号を対応付けて入力された目標性能を満足するように符号定義を決定する符号定義部と、符号定義を付加情報として出力する符号定義出力部としての機能を実行させることを特徴とするプログラムを提供する。

さらに、この発明は、パターンのパターン認識結果と各パターンに対応付けられた付加情報とに基づいて複数のカテゴリーから各パターンが属するカテゴリーを決定する認識手法に係る前記付加情報をパターンに付与する処理をコンピュータに実行させる付加情報付与プログラムであって、パターンの真のカテゴリーを取得する真のカテゴリー取得部と、前述の付加情報決定プログラムを用いて決定された符号定義を格納する符号定義格納部と、パターンの真のカテゴリーに対応する符号を符号定義に基づいて決定する符号決定部と、決定された符合を付加情報として出力する付加情報出力部としての機能を実行させることを特徴とするプログラムを提供する。

さらにまた、この発明は、パターンのパターン認識結果と各パターンに対応付けられた付加情報とに基づいて複数のカテゴリーから各パターンが属するカテゴリーを決定する認識手法に係るパターン認識処理をコンピュータに実行させるプログラムであって、パターンのデータを取得するパターンデータ取得部と、取得したデータから、認識すべきパターンと付加情報とを抽出するパターン抽出部と、予め提供された混同行列を格納する混同行列格納部と、抽出された付加情報から各パターンに対応する符号を取得し、前述の符号定義に基づいて真のカテゴリーのグループを決定する符号解析部と、各パターンのパターン認識結果に対応する混同行列中の各要素中で、取得された符合から決定された真のカテゴリーのグループに属する要素を参照し、最も確率の高いカテゴリーを各パターンの属するカテゴリーとして決定する認識部と、決定された各パターンのカテゴリーを出力する認識結果出力部としての機能を実行させることを特徴とするプログラムを提供する。

また、さらに異なる観点から、この発明は、パターンのパターン認識結果と各パターンに対応付けられた付加情報とに基づいて複数のカテゴリーから各パターンが属するカテゴリーを決定する認識手法に係る前記付加情報を決定する付加情報決定装置であって、各パターンがパターン認識されたときに真のカテゴリーを含む各カテゴリーに属すると判定されるそれぞれの確率を要素とする混同行列を取得する混同行列取得部と、目標の認識性能を入力させる目標性能入力部と、混同行列を参照し、各パターンの真のカテゴリーに対して当該パターンに付加すべき付加情報の符号を対応付けて入力された目標性能を満足するように符号定義を決定する符号定義部と、符号定義を付加情報として出力する符号定義出力部とを備えることを特徴とする装置を提供する。

また、この発明は、パターンのパターン認識結果と各パターンに対応付けられた付加情報とに基づいて複数のカテゴリーから各パターンが属するカテゴリーを決定する認識手法に係る前記付加情報をパターンに付与する付加情報付与装置であって、パターンの真のカテゴリーを取得する真のカテゴリー取得部と、前述の付加情報決定装置を用いて決定された符号定義を格納する符号定義格納部と、パターンの真のカテゴリーに対応する符号を符号定義に基づいて決定する符号決定部と、決定された符合を付加情報として出力する付加情報出力部とを備えることを特徴とする装置を提供する。

さらにまた、この発明は、パターンのパターン認識結果と各パターンに対応付けられた付加情報とに基づいて複数のカテゴリーから各パターンが属するカテゴリーを決定する認識手法に係るパターン認識装置であって、パターンのデータを取得するパターンデータ取得部と、取得したデータから、認識すべきパターンと付加情報とを抽出するパターン抽出部と、予め提供された混同行列を格納する混同行列格納部と、抽出された付加情報から各パターンに対応する符号を取得し、前述の符号定義に基づいて真のカテゴリーのグループを決定する符号解析部と、各パターンのパターン認識結果に対応する混同行列中の各要素中で、取得された符合から決定された真のカテゴリーのグループに属する要素を参照し、最も確率の高いカテゴリーを各パターンの属するカテゴリーとして決定する認識部と、決定された各パターンのカテゴリーを出力する認識結果出力部とを備えることを特徴とする装置を提供する。

この発明に係るパターン認識は、付加情報をパターンと同時に認識系に入力し、パターンと付加情報から矛盾のない答えを導く手法である。ここで認識系とは、識別器と付加情報の受信機（復号器）の情報を統合し、妥当な認識結果を算出するものである。この方式は従来の一般的なパターン認識（図２０（ａ））と、後述するコードをそのまま伝達する場合（図２０（ｂ））との折衷と考えることができる。

要求される認識性能を満足するために付加すべき必要かつ十分な付加情報の特性について、さらに説明する。この発明で扱う付加情報は、クラス数をＮとしたとき、Ｋ種類の記号（Ｋ≦Ｎ）を用意し、そのうち一つずつを各クラスに割り当てるものである。このとき、付加情報の情報量はビット換算でlog₂Ｋビットである。もしＮ種類の記号（ビット換算でlog₂Ｋビットの情報）を用いるならば、これは図２０（ｂ）のようにコードを伝達することに等しく、認識系は確実に正解クラスを言い当てることができる。したがって、認識率１００％が達成可能である。しかし、認識率１００％を達成するためには常にＮ種類の記号が必要なわけではなく、識別器の性能が良ければ必要な情報量は減少する。このように、認識率１００％を達成するために必要な情報量は識別器の性能に依存するものと考えられ、識別器の性能に応じた付加情報を付加することが、要求される認識性能を満足しかつ付加情報の情報量を最小限に留めるために重要である。
なお、付加情報の具体的な態様としては、例えば、公知の二次元バーコードを用いることができるが、これに限定されるものではない。

この明細書で、文書画像とは、文書の画像データである。文書とは、文字で表された情報をいう。文書の一例は、契約書やパンフレットのようなビジネス文書、科学技術論文、新聞、カタログである。また、特に断らずに「認識率」と「リジェクト率」という語を用いる場合、「認識率」は、全クラスの平均認識率を意味し、「リジェクト率」は、全クラスの平均リジェクト率を意味する。

この発明の付加情報の決定方法は、各パターンがパターン認識されたときに真のカテゴリーを含む各カテゴリーに属すると判定されるそれぞれの確率を要素とする混同行列を取得する工程と、目標の認識性能を入力させる工程と、混同行列を参照し、各パターンの真のカテゴリーに対して当該パターンに付加すべき付加情報の符号を対応付けて入力された目標性能を満足するように符号定義を決定する符号定義工程とをコンピュータが実行するので、目標の認識性能を満足するために必要かつ十分な付加情報をパターンと同時に識別器に与えるように符号定義を決定することができる。

前記目標の認識性能が認識率として入力され、前記符号定義工程が、1以上のカテゴリーをメンバーとするグループであって、各グループのうち各カテゴリーに属すると判定される混同行列に基づく確率が最も高いカテゴリーを除くカテゴリーの合計の確率の全カテゴリーについての和を最小にするようなグループを決定して各グループを識別する符号を付すことにより、目標の認識率を満足しかつ符号の数を最小にするグループ分けと各グループに付された符号とを符号定義として決定する工程であってもよい。このようにすれば、目標性能としての認識率が与えられた場合に、目標を満足するために必要かつ十分な付加情報を提供する符号定義を決定することができる。

あるいは、前記目標の認識性能がリジェクト率として入力され、前記符号定義工程が、1以上のカテゴリーをメンバーとするグループであって、各グループのうち各カテゴリーに属すると判定される混同行列の確率の和の全カテゴリーについての和を最小にするようなグループを決定して各グループを識別する符号を付すことにより、目標の認識率を満足しかつ符号の数を最小にするグループ分けと各グループに付された符号とを符号定義として決定する工程であってもよい。このようにすれば、目標性能としてリジェクト率が与えられた場合に、目標を満足するために必要かつ十分な付加情報を提供する符号定義を決定することができる。

また、この発明の付加情報決定プログラムは、各パターンがパターン認識されたときに真のカテゴリーを含む各カテゴリーに属すると判定されるそれぞれの確率を要素とする混同行列を取得する混同行列取得部と、目標の認識性能を入力させる目標性能入力部と、混同行列を参照し、各パターンの真のカテゴリーに対して当該パターンに付加すべき付加情報の符号を対応付けて入力された目標性能を満足するように符号定義を決定する符号定義部としての機能をコンピュータに実行させるので、目標の認識性能を満足するために必要かつ十分な付加情報をパターンと同時に識別器に与えるように符号定義を決定する処理を実行させることができる。

前記目標の認識性能が認識率として入力され、前記符号定義部が、1以上のカテゴリーをメンバーとするグループであって、各グループのうち各カテゴリーに属すると判定される混同行列に基づく確率が最も高いカテゴリーを除くカテゴリーの合計の確率の全カテゴリーについての和を最小にするようなグループを決定して各グループを識別する符号を付すことにより、目標の認識率を満足しかつ符号の数を最小にするグループ分けと各グループに付された符号とを符号定義として決定してもよい。このようにすれば、目標性能としての認識率が与えられた場合に、目標を満足するために必要かつ十分な付加情報を提供する符号定義を決定することができる。

あるいは、前記目標の認識性能がリジェクト率として入力され、前記符号定義部が、1以上のカテゴリーをメンバーとするグループであって、各グループのうち各カテゴリーに属すると判定される混同行列の確率の和の全カテゴリーについての和を最小にするようなグループを決定して各グループを識別する符号を付すことにより、目標の認識率を満足しかつ符号の数を最小にするグループ分けと各グループに付された符号とを符号定義として決定してもよい。このようにすれば、目標性能としてリジェクト率が与えられた場合に、目標を満足するために必要かつ十分な付加情報を提供する符号定義を決定することができる。

さらに、この発明の付加情報付与プログラムは、パターンの真のカテゴリーを取得する真のカテゴリー取得部と、パターンの真のカテゴリーに対応する符号を符号定義に基づいて決定する符号決定部としての機能をコンピュータに実行させるので、各パターンに対応する符号を決定することができる。

さらにまた、この発明のパターン認識プログラムは、抽出された付加情報から各パターンに対応する符号を取得し、前述の符号定義に基づいて真のカテゴリーのグループを決定する符号解析部と、各パターンのパターン認識結果に対応する混同行列中の各要素中で、取得された符合から決定された真のカテゴリーのグループに属する要素を参照し、最も確率の高いカテゴリーを各パターンの属するカテゴリーとして決定する認識部としての機能をコンピュータに実行させるので、パターン認識と付加情報からパターンの属すべきカテゴリーを決定することができる。

また、この発明の付加情報決定装置は、各パターンがパターン認識されたときに真のカテゴリーを含む各カテゴリーに属すると判定されるそれぞれの確率を要素とする混同行列を取得する混同行列取得部と、目標の認識性能を入力させる目標性能入力部と、混同行列を参照し、各パターンの真のカテゴリーに対して当該パターンに付加すべき付加情報の符号を対応付けて入力された目標性能を満足するように符号定義を決定する符号定義部とを備えるので、目標の認識性能を満足するために必要かつ十分な付加情報をパターンと同時に識別器に与えるように符号定義を決定する処理を実行させることができる。

前記目標の認識性能が認識率として入力され、前記符号定義部が、1以上のカテゴリーをメンバーとするグループであって、各グループのうち各カテゴリーに属すると判定される混同行列に基づく確率が最も高いカテゴリーを除くカテゴリーの合計の確率の全カテゴリーについての和を最小にするようなグループを決定して各グループを識別する符号を付すことにより、目標の認識率を満足しかつ符号の数を最小にするグループ分けと各グループに付された符号とを符号定義として決定してもよい。このようにすれば、このようにすれば、目標性能としての認識率が与えられた場合に、目標を満足するために必要かつ十分な付加情報を提供する符号定義を決定することができる。

さらに、この発明の付加情報付与装置は、パターンの真のカテゴリーを取得する真のカテゴリー取得部と、パターンの真のカテゴリーに対応する符号を符号定義に基づいて決定する符号決定部とを備えるので、各パターンに対応する符号を決定することができる。

さらにまた、この発明のパターン認識プログラムは、抽出された付加情報から各パターンに対応する符号を取得し、前述の符号定義に基づいて真のカテゴリーのグループを決定する符号解析部と、各パターンのパターン認識結果に対応する混同行列中の各要素中で、取得された符合から決定された真のカテゴリーのグループに属する要素を参照し、最も確率の高いカテゴリーを各パターンの属するカテゴリーとして決定する認識部とを備えるので、パターン認識と付加情報からパターンの属すべきカテゴリーを決定することができる。

以下、図面を用いてこの発明をさらに詳述する。以下の説明により、この発明をよりよく理解することが可能であろう。なお、以下の説明は、すべての点で例示であって、制限的なものではないと考えられるべきである。

この発明の実施形態の説明に先立ち、まず、ＣＭの詳細について説明する。ＣＭとは、識別器に入力されるパターンが属するクラス（真のクラス）と識別器が出力するクラス（認識結果）の対応を表す行列である。通常、ω₁,ω₂,…,ω_Nをクラス、Ｎ×Ｎ行列ＣをＣＭとすると、Ｃの(ｉ,ｊ)要素c_ijはクラスω_iに属するパターンを認識によってクラスω_jに属すると判断した回数を表す。

＜Confusion Matrixの確率表現＞
クラスω_iに属するパターンをクラスω_jであると認識する確率Ｐ(ω_j｜ω_i)を(ｉ,ｊ)要素に持つＮ×Ｎ行列Ｗを定義する。Ｗは、Ｃの各行の要素の和が１になるように正規化して得られる。すなわち、
とおいたとき、Ｗの(ｉ,ｊ)要素w_ijは
で与えられる。
図４は、混同行列Ｗの一例を示す説明図である。図４の混同行列Ｗで、数字の無い要素は、その値が０である。

＜Confusion Matrixの作成＞
特定の識別器に対応するＣＭを作成する手順は以下のとおりである。まず、識別器に認識させるパターンを用意する。パターンの種類は、識別させるべきパターンの種類、即ち真のクラスの数だけの種類を含み、各種類に属する十分な数のパターンを用意する。図４を例に説明すると、Ａ、Ｂ、Ｃ、Ｄ、Ｅの５種類の文字を認識させる場合、５種類の各クラスに属する文字パターン、即ち、Ａ、Ｂ、Ｃ、Ｄ、Ｅの各文字パターンを準備する。そして、例えばＡの文字パターンとして、例えば、複数の人が書いた筆跡の異なる手書き文字、異なる書体の印刷文字、一部がかすれた文字など種々のパターンを用意する。
本発明で認識性能を十分に発揮するためには、文書画像を作成、配布、撮像して認識されるまでの諸条件が明確であって、付加情報を付加する段階で想定する条件と同一または想定する条件に含まれていることが望ましい。すなわち、用いるＣＭは、特定のフォントのみを用いて作成されたり、文書画像が特定の劣化を起こしていたり、特定の条件で画像を取り込んだりなどの諸条件がなるべく詳しくわかっている方がよい。特定のフォントとは、日本語の場合は明朝体のみを対象とする場合やゴシック体のみを対象とする場合など、認識対象の文字の字形が大きく異なる場合は、認識誤りが増えたり、認識誤りの傾向が異なったりするために、ＣＭを別に作成したほうが良い場合がある。また、文書画像の劣化とは、認識対象である文字のつぶれやかすれなど、複写やファックスに起因する画像の劣化を始め、紙の汚れ、経年劣化による紙の変色、変形など、認識対象パターン自体の劣化や認識対象パターンを記録する媒体である紙などの劣化のことをいう。
認識対象パターンを記録する媒体は紙だけでなく、例えば、看板やガラス窓、瓶などでもよい。また、画像の取り込み条件とは、特定のメーカーのスキャナを用いた場合や、特定のメーカーのデジタルカメラを用いた場合、特定のメーカーのビデオカメラを用いた場合、特定の照明条件の下で特定のデジタルカメラを用いて画像を取得した場合や、水中など、特定の環境下で文書画像を撮像したりした場合などが考えられる。さらに、認識対象パターンを記録する媒体とカメラなどの撮像する機器との位置関係も重要である。これは撮像する角度が変わると得られる画像が変化するからである。さらに、認識対象パターンを記録する媒体が瓶など、最初から形が平面でない場合は、媒体とカメラの位置関係のみならず、媒体の向きによっても取得できる画像が変化する。このように、一般には撮像した結果、異なる画像が得られる２条件は別の条件であると考えたほうがよい。
前述のように別々の条件で作成した２つ以上のＣＭは、認識対象のクラスが同じであれば容易に合成することができる。すなわち、ある条件Ａで作成したＣＭと別の条件Ｂで作成したＣＭがあるとき、条件Ａにおいても条件Ｂにおいても本発明に有効なＣＭを作成するためには、２つのＣＭを認識パターンの頻度に応じて加重平均すればよい。利用条件によっては、単に平均すればよいこともある。
認識対象のクラスが同じでなければ、例えば、ＣＭ１にはＡ、Ｂ、Ｃという３つのクラスがあり、ＣＭ２にはＡ、Ｂ、Ｄ、Ｅという４つのクラスがあったならば、ＣＭ１のＤ、Ｅに対応する行と列に含まれる要素とＣＭ２のＣに対応する行と列には、値が０の要素を挿入し、５ｘ５のＣＭにしてから加重平均すればよい。
このように、ＣＭの合成は非常に容易であるため、実用上は認識対象や、認識条件、撮像条件等の条件を細分化してＣＭを作成、配布し、ＣＭを使用する段階でＣＭを合成する方法も考えられる。

準備したパターンを全て符号なしで認識させ、真のクラス、即ち、正解に対する認識結果をマトリックスにする。そして、マトリックスの各行の要素の和が１になるように正規化をする。正規化されたＣＭの各要素の値は、その行に対応する真のクラスのパターンを識別器に認識させたとき、当該要素の列に対応するクラスが認識結果として出力される割合を示す。

スキャナの機種に応じて、あるいは同一機種において解像度や階調特性などが互いに異なる複数のモードに対応して、前述の認識パターンを認識させる作業を行い、ＣＭを準備する。前述の作業は、手作業により行ってもよいし、少なくとも一部をコンピュータに処理させてもよい。
なお、ＣＭの推定問題は確率分布の推定問題に帰着するため、ＣＭの推定には十分な数のサンプルを用いることを前提とする。

また、前述の説明のように、ＣＭは、ある機種のスキャナや、モードに対して決まるが、作成された複数のＣＭを合成して複数の機種および／またはモードに対応するＣＭを得ることも可能である。このように、認識性能および／または読み取り特性の異なる複数の認識器に対応するＣＭを用いれば、符号が付与されたパターンを認識させるスキャナの選択範囲が広がる。一方、一般的に対応機種を限定するほど、符号の情報量は少なくてよい。そこで、例えば、不特定多数に対して公開する文書データには広範な機種に対応したＣＭを用いて符号を付与し、特定の相手に送付する文書データには、相手の所有するスキャナに対応するＣＭを用いた少ない情報量の符号を付与するなど、用途に応じて後述する符号の付与処理に用いるＣＭを選択するようにしてもよい。
次に、提供されたＣＭに基づいて、要求された認識性能を満たすために付与すべき符号の特性と、情報量、即ちビット数とを決定する手順について説明する。

（実施の形態１）
この実施の形態では、パターンと符号が与えられる認識系において、認識率１００％かつリジェクト率０％を実現するために付加すべき符号を決定する方法について説明する。図５は、この実施の形態に係る認識系の構成を示す説明図である。以降の説明で、認識系は記号とクラスの対応表とＣＭ(行列Ｗ)を持っているとする。また、簡単のために各クラスのサンプルは等確率で生成されるとする。すなわち、クラス数をＮとしたとき、事前確率はＰ(ω₁)＝１／Ｎである。

１．行列Ｗの分割
この発明に係る符号付与の方法では、前述の手順で予め識別器に応じて作成されたＣＭに対して、ＣＭの各行に付加情報となる記号を割り当てる。ｋ番目の記号を割り当てた行の集合を
とおき、ＷをＨ₁,…,Ｈ_Kに分割する。ここで｜Ｈ_K ｜はｋ番目の記号を割り当てられた行数である。例えば、図６は図４のＣＭに３種類の記号を割り当てた例を示す説明図である。この場合はＨ₁＝｛１,２｝，Ｈ₂＝｛３,４｝，Ｈ₃＝｛５｝となる。ただし、Ｈ_Kの要素は連続している必要はない。

次に、ｋ番目の記号が割り当てられた行の要素のうちｊ列目の要素を
とおく。例えば、図６の場合、Ｂ₁₁＝｛(１,１),(２,１)｝である。そして、(1,1)に対応する要素をＷの要素として表記すれば、w₁₁＝０.６であり、(2,1)に対応する要素は、w₂₁＝０である。

２．符号が満たすべき条件
認識率１００％かつリジェクト率０％を実現するために付加情報が満たすべき条件を図４を例に説明する。図４によると認識結果がＡになるのは真のクラスがＡ，Ｃ，Ｅのいずれかのときである。これらは当然、識別器では区別できない。もし識別器がそのままＡと出力してしまうと、真のクラスがＣやＥだった場合には誤認識が生じてしまう。そのため、真のクラスがＡ，Ｃ，Ｅのいずれであったのかを区別する情報が必要となる。そこでＡ，Ｃ，Ｅにそれぞれ別々の記号を割り当てると、誤認識が生じない代わりに少なくとも３種類の記号が必要となる。

同様に、認識結果がＢになるのは真のクラスがＢ，Ｄ，Ｅのいずれかのときであるので、Ｂ，Ｄ，Ｅにも別々の記号を割り当てる。このように考えていくと、図６のように、ＡとＢ、ＣとＤ，Ｅに別々の記号を付加することでリジェクトを行うことなく認識率１００％が達成できる。また、ＡとＤ、ＢとＣ、Ｅという割り当てでも同様である。つまり、認識率１００％かつリジェクト率０％を実現するために付加情報が満たすべき条件は、全てのｋ，ｊについてＢ_kj内に値が０でない要素が２つ以上存在しないことである。

例えば、図６において、Ｂ₁₁＝｛(1,1),(2,1)｝＝｛w₁₁,w₂₁｝＝｛0.6,0｝であるので、Ｂ₁₁内に値が０でない要素は、w₁₁だけであり前記の条件を満たす。同様に、Ｂ₁₂＝｛(1,2),(2,2)｝＝｛0,0.8｝、Ｂ₁₃＝｛(1,3),(2,3)｝＝｛0.4,0｝、Ｂ₁₄＝｛(1,4),(2,4)｝＝｛0,0.1｝、Ｂ₁₅＝｛(1,5),(2,5)｝＝｛0,0.1｝であり、いずれも前記条件を満足する。また、Ｂ₂₁＝｛(3,1),(4,1)｝＝｛0.1,0｝、Ｂ₂₂＝｛0,0.1｝、Ｂ₂₃＝｛0.9,0｝、Ｂ₂₄＝｛0,0.8｝、Ｂ₂₅＝｛0,0.1｝であり、いずれも前記条件を満足する。さらに、Ｂ₃₁＝｛0.2｝、Ｂ₃₂＝｛0.1｝、Ｂ₃₃＝｛0｝、Ｂ₃₄＝｛0｝、Ｂ₃₅＝｛0.7｝であり、要素が１つであるから前記条件を満足することは自明である。従って、図６のように符号を付加した場合には、認識率１００％かつリジェクト率０％の実現が可能であるとわかる。

３．情報量が最小の符号を決定する方法
参考に、グラフを用いた符合の決定手順を説明する。各クラスに対応するＮ個のノードからなる集合Ｖと、Ｖの要素間を結ぶエッジの集合Ｅを考え、無向グラフＧ＝(Ｖ,Ｅ)を定義する。同じ記号を割り当てても誤認識が起こらない２クラスを、ノード間にエッジを張ることで表す。ここでクラスｉとクラスｊに同じ符号を割り当てても誤認識が起こらないのはw_ij＝w_ji＝０のときである。

該当する全てのエッジを張り、最後にグラフＧをできるだけ少ない完全グラフに分割する。例として、図６を表すグラフを図７に示す。このときの完全グラフ、即ち全てのノード間にエッジが張られたグラフの数をＮ_symminとおく。完全グラフ毎に唯一の記号を割り当てるので、Ｎ_symmin種類の記号があれば認識率１００％かつリジェクト率０％を実現できる。このとき必要な情報量はlog₂Ｎ_symminである。

Ｎ_symminは最も誤認識され易いクラスの性質によって決まる値である。一般にパターン認識問題には認識が容易なクラスと困難なクラスが存在しているが、同様に誤認識され易いクラスとされ難いクラスも存在する。誤認識され易いクラスとは、ＣＭを列毎に見たとき、０でない要素が多い列に対応するクラスである。図８は、誤認識され易いクラスを含むＣＭの例を示す説明図である。図８のＣＭでは、どのクラスのサンプルもクラスＣに誤認識され得る。

認識率１００％を達成するためには、識別器の認識結果が最も誤認識され易いクラスになったとしても、認識系全体では正しい認識結果を出力できるだけの情報量を与える必要がある。例えば、図４のＣＭの場合はＮ_symminなのでlog₂3≒1.58となり、図８のCMの場合はＮ_symmin＝５なのでlog₂5≒2.32となる。図４と図８のＣＭから計算される認識率はそれぞれ７６％と９２％であるので、単純に認識率が高ければ付加情報が小さくて済むというものではない。このような現象が実際のＣＭでも起こることは、後述する実験例１にも示されている。

上記の説明は、認識率１００％かつリジェクト率０％を達成する符合の割り当て方と必要な符号の数Ｎ_symminを求める手順を説明したが、目標の認識性能をさらに一般化することについて説明する。

（実施の形態２）
実施の形態１では認識率１００％かつリジェクト率０％を達成するために付加する符号を決定する方法について説明した。認識率１００％かつリジェクト率０％は、理想の認識系であるが、実用的には、そこまでの性能が要求されず、むしろ付加する情報量を減らす方を優先する場合も考えられる。この実施の形態では、リジェクト率が０％のときと誤認識率が０％のときに注目して、付加する情報量と認識性能との関係について説明する。具体的には、
（１）リジェクトを行わないときに付加すべき符号の情報量と認識率の関係、
（２）誤認識率を０％に保つことを条件に付加すべき符号の情報量と必要なリジェクト率との関係、
について説明する。実は付加情報の情報量、達成可能な認識率、必要なリジェクト率は３つのうち２つの値を決めると残りの１つの値が決まる関係にある。

１．Ｂ_kj内の０でない要素数
実施の形態１を一般化し、誤認識やリジェクトを損失として扱うために、前述のＣＭの要素Ｂ_kj内の０でない要素数を定義する。

最初に、値が０であれば０、さもなくば１を返す関数
を定める。すると、Ｂ_kjに含まれる要素のうち、w_lj≠０を満たす要素の数q_kjは関数ｚ(ｘ)を用いて次式で与えられる。
即ち、q_kjは、Ｗを行の要素の集合に分割し、そのうちでｊ列の要素からなる集合Ｂ_kjに含まれる要素のうち、０でないものの数を与える。

２．リジェクトを行わないときに付加すべき符号の情報量と認識率の関係
２．１．損失関数
誤認識が起こる確率を損失で表す。実施の形態１の項目２で述べたように、Ｂ_kj内に値が０でない要素が１つ以下しか存在しない場合(q_kj≦１)は誤認識が生じず、２つ以上の０でない要素が存在した場合(q_kj≧２)は誤認識が生じる。このとき、認識結果になり得る真のクラスはq_kj通りの可能性があるが、認識結果として出力できるのはそのうち１つのクラスだけである。取り得る損失が最も小さい方法は、事後確率が最大になる要素を出力として採用することである。図９は、付加情報の情報量が図６より小さい場合であって、誤認識を許容して誤認識を避ける場合の符号の例を示す説明図である。図９で、反転表示は、損失になる要素を示す。例えば、図１２の場合、記号が２で認識結果がＡであれば、Ｃと出力するよりもＥと出力したほうが損失が小さいので、Ｅと出力すればよい。
以上より、損失関数Ｌ₁を次式のように定式化し、認識結果になり得る真のクラスが複数存在する場合(q_kj≧２)に、それらのクラスから１つのクラスを選択することによって生じる損失を最小にすることを考える。ＣＭの作成の説明で述べたように、正規化されたＣＭの各要素は、その行のクラスを真のクラスとするパターンを認識したときにその列のクラスを認識結果として出力する確率を示す。たとえば、真のクラスがＡであるパターンの認識結果がＡの場合、対応する要素は、ＡがＡと正しく認識される確率を示す。一方、真のクラスがＡであるパターンに対してＣが認識結果として出力される場合、それに対応する要素は、ＡがＣとして誤認識される確率を示す。
ここで、Ｌ₁を以下のように定義する。Ｌ₁は真のクラス毎の誤認識率の和であり、言い換えると、全クラスの平均誤認識率にクラス数を乗じたものである。
式（７）の括弧内は第１項がＢ_kj内の要素の和、第２項が損失にならない要素（出力するクラスに対応する要素）を表す。第２項として、確率が最大の要素を選択するので、認識に伴う損失は常に最小になる。

後述するように、要求される認識性能に対応して、損失関数のしきい値Ｔが決まる。
記号の種類Ｋに対して、そのときの損失の値を上記式に基づいて与える関数を、損失関数とする。この実施の形態では、図１０の欲張り法の処理ルーチンの中で損失関数を用いる。図１０は、損失最小を目指す欲張り法の処理ルーチンの実行手順を示す説明図である。図１０の処理ルーチンでは、記号の種類ＫをＮから１つずつ減っていき、その都度損失を計算する。Ｋ＝１は通常のパターン認識と等価である。なお、Ｎが大きいときに最適な符号の割り当てを現実的な時間で求めるアルゴリズムは知られておらず、図１０のアルゴリズムも最適な割り当てを保証するアルゴリズムではない。
図１０に示すように、まず、ＣＭの全てのクラスに別々の記号を割り当てる（Ｓ１）。即ち、Ｋ＝Ｎである。このとき、Ｈ_Kは、それぞれ１つの行の要素からなる集合である。

次に、損失の計算に用いる損失関数を選択する（Ｓ２）。後述するように、要求性能として認識率が指定される場合と、リジェクト率が指定される場合とで、損失を計算する式が異なるからである。ここでは、上記Ｌ₁の計算式が選択されるものとする。

符号の数を１つ減らす処理を行う。即ち、同じ記号を割り当てると仮定した場合の損失関数Ｌ₁を、全ての組み合わせについて計算する。ただし、損失が０となる組が見つかった場合は、その組合せが最小の損失を実現することが自明であるので、その組合せを採用し残りの組み合わせについての損失計算は行わなくてよい。各組合せに対応するＬ₁の値を比較して、Ｌ₁を最小にする組合せを採用し符号の数を１減らす（Ｓ４）。そのときのＬ₁の最小値がＬ（Ｋ）である。

Ｌ（Ｋ）がしきい値Ｔよりも小さいか、等しければ、その段階の組合せを仮の符号とする。そして、さらに符号の数を１減らす処理を繰り返す。Ｌ（Ｋ）がしきい値Ｔより大きくなった場合は、要求される認識性能を満足しないので、そのときのＫより１大きい符号の数、即ち仮の符号とされている符号を付加すべき符号の定義とする。

以上の処理をコンピュータに実行させることにより、目標とする認識性能を満足するために付与すべき符号を決定することができる。

前述の処理手順を、別の表記方法を用いて説明する。図１１は、図１０の処理ルーチンを図４に適用した場合の符号と損失Ｌ₁の推移を示す説明図である。

図１１で、「符号の種類」は記号の種類Ｋであり、損失Ｌ₁はそのときのＫに対する損失を表す。右側のグラフは、損失に対応する符合の割り当て方（符号定義）を表した図である。例えば、図１１で記号の種類が３のときはＡとＢに１、ＣとＤに２、Ｅに３というような割り当て方をすることによって、損失Ｌ₁が０になる割り当てが可能である。この割り当ては図６に等しい。
（１，２，３のような具体的な記号の値は何でもよく、例えば４，５，６でもよい。）
図１１に示すように、前述の処理手順に従って、最初は５種類の記号をそれぞれ５つのクラスに対応付ける。その後、同一の記号に置き換えたときに損失の増加が最も少ない２種類の記号を選び、同一の記号を割り当てる。例えば、記号の種類を５から４に減らすとき、別々の記号を割り当ててあったＡとＢ、ＣとＤ、ＡとＤ、ＢとＣに同一の記号を割り当てても損失が増加しない。このような記号の組のうち、ここではＡとＢに同一の記号を割り当てている。このように、前述の手順を繰り返せば、記号の種類がＮのときから始めて１になるまで記号の種類を減らしながら近似的に損失が最も小さくなる記号の割り当て方を求めることができる。これらの処理をコンピュータに実行させるプログラムを作成することは容易である。
次に、認識系が満足すべき認識性能と損失関数との関係について説明する。この関係から、目標の認識性能が決まると、損失関数のしきい値を求めることができる。

２．２．認識率
全クラスの平均認識率を求めるために、まず全クラスの平均誤認識率を求める。損失関数Ｌ₁は文字毎の誤認識率の和であるので、Ｌ₁を文字数で割れば平均誤認識率が得られる。１から平均誤認識率を引けば平均認識率であるので、平均認識率はＲ_recog＝１−Ｌ₁／Ｎで与えられる。この式は、平均認識率とクラスの数Ｎから損失関数が達成すべき値、即ちしきい値を与えるものである。クラスの数Ｎは、与えられたＣＭの行あるいは列の数であるから、平均認識率が決まれば、損失関数のしきい値が決まる。

３．誤認識率を０％に保つことを条件に付加すべき符号の情報量と必要なリジェクト率の関係
次に、誤認識率を０％に保つことを条件に付加すべき符号の情報量を決定する場合、あるいは符号の情報量が決まった場合のリジェクト率について説明する。

３．１．損失関数
リジェクトする確率を損失で表す。Ｂ_kj内に値が０でない要素が１つ以下しか存在しない場合(q_kj≦１)は誤認識が生じず、２つ以上の０でない要素が存在する場合(q_kj≧２)は誤認識が生じる。このとき、認識結果に成り得る真のクラスはq_kj通りの可能性があるが、認識率１００％を達成するためには、誤る可能性のある場合は全てリジェクトするしかない。図１２は、付加情報の情報量が図６より小さい場合であって、リジェクトなしで誤認識を許容する場合の符号の例を示す説明図である。図１２で、反転表示は、損失になる要素を示す。例えば、図１２の場合、記号が２で認識結果がＡであれば、Ｃと出力してもＥと出力しても誤認識の可能性が残る。そのため、この場合はいずれもリジェクトし、全て損失となる。

以上より、損失関数Ｌ₂を次式のように定式化し、損失を最小にする問題を考える。ここでＬ₂は真のクラス毎のリジェクト率の和であり、言い換えると、全クラスの平均リジェクト率にクラス数を乗じたものである。
ただし、ここでｓ_kjは
である。
４．２．１と同様に、図１０の処理ルーチンを図４に適用した場合の符号と損失Ｌ₂の推移を図１３に示す。

３．２．リジェクト率
全クラスの平均リジェクト率を求める。損失関数Ｌ₂は文字毎のリジェクト率の和であるので、Ｌ₂を文字数で割れば平均リジェクト率が得られる。したがって、平均リジェクト率はＲ_reject＝Ｌ₂／Ｎで与えられる。この式は、目標性能として平均リジェクト率が与えられた場合の損失関数Ｌ２のしきい値を与えるものである。

以上の説明のように、要求される認識性能と認識器の性能を示すＣＭとが与えられた場合に、認識性能に応じた損失関数が決まり、損失関数のしきい値を求めることができる。そして、決定した損失関数を用いて図１０の処理手順を実行し、要求性能を満足するための符号を決定することができる。

符号の決定をコンピュータに実行させる処理はＣＭを作成する者が行って、ＣＭと共に符号を提供してもよい。前述のように、付与すべき符号は要求される認識性能に依存する。ＣＭと共に符号が提供される場合、認識性能は予め決定されていることが前提となる。例えば、識別器を生産する者が、識別器と共に、ＣＭと符号のデータを提供する形態がこれに相当する。この場合、例えば、認識性能として、認識率１００％、リジェクト率０％を実現するための符号が提供される。

あるいは識別器のユーザにＣＭと、符号を決定する符号決定プログラムが提供されてもよい。ユーザは、使用目的に応じた認識性能を指定して提供されたＣＭに対して符号決定プログラムを実行することにより、要求性能を満足する符号を決定することができる。このようにすれば、使用目的あるいは使用環境に応じた符号を付加することができる。

図１は、この発明に係る符号をＣＭに基づいて決定する処理をコンピュータに実行させる符合決定プログラム、あるいは符号決定処理装置の機能的な構成例を示すブロック図である。図１に示すように、符号決定プログラムあるいは符号決定装置は、混同行列取得部に相当し、ＣＭのデータを入力させて取得するＣＭデータ入力処理部５７、目標性能入力部に相当し、目標の認識性能、即ち平均認識率あるいは平均リジェクト率を入力させる目標性能設定処理部５１、提供されたＣＭに基づき、図１０の処理ルーチンに従って認識性能を満足するように文字をグループ分けし、各グループに割り当てる記号を定義する符号定義部５３、符号定義の処理において損失関数の値を計算する損失関数計算部５９、決定した符号定義を出力する符号定義出力部５５から構成される。

図１７は、コンピュータが実行する符号決定プログラムの処理手順を示すフローチャートである。図１７に示すように、符号決定プログラムを実行するコンピュータは、まず、ＣＭデータ入力処理部５７として機能し、ＣＭのデータを取得する処理を実行する（ステップＳ１０１）。ＣＭデータは、識別器の生産者から提供されるものであってもよいし、前記生産者とは異なる第三者が提供するものであってもよい。ＣＭデータの物理的な取得手段としては、例えば、符号決定プログラムを実行するコンピュータが、通信を介して外部からデータを取得してもよいし、ＤＶＤやＣＤなどのデータ記録メディアに記録されたデータを読み取ってもよい。

次に、コンピュータは、目標性能設定処理部５１として機能し、ユーザに目標の認識性能を入力させる処理を実行する（ステップＳ１０３）。具体的には、前記コンピュータの画面に認識性能を設定するメニュー画面を表示し、ユーザが要求する認識性能の種類や値を入力させる。例えば、認識性能の種類が平均認識率であり、その値が１００％である。

ユーザが必要な項目を入力し終えるのを待って（ステップＳ１０５）、前記コンピュータは、符号定義処理部５３として、符号の決定処理を行う。まず、指定された認識性能に対応する損失関数を選択するために、リジェクト率が認識性能として入力されたかどうかを判断する（ステップＳ１０７）。リジェクト率が入力された場合、損失関数として前記Ｌ２を使用することを決定し、入力されたリジェクト率に対応するしきい値Ｔ２を計算する（ステップＳ１１３）。そして、前述した図１０の処理手順を事項して、しきい値Ｔ２を上回らないが記号の種類Ｋが最も少ない符号を決定する（ステップＳ１１５）。符号決定処理に際しての損失関数の計算は、図１の機能ブロックのうち損失関数計算部５９に対応する。そして、前記コンピュータは、符号定義出力部５５として機能し、決定した符号定義を結果として出力する。符号定義は、具体的には、各文字コードに対して符号としての記号が定義されたデータテーブルとして与えられ、データファイルとして出力される。

符号決定プログラムを実行するハードウェアとしては、汎用のコンピュータ、例えばパーソナルコンピュータを用いることができる。ただし、ハードウェアは、パーソナルコンピュータに限定されるものではなく、例えば、大型コンピュータや携帯情報端末であってもよく、あるいは、デジタル複合機など、印字データを受けて画像を出力する画像形成装置であってもよい。
次に、符号定義が決定された後、認識パターンと認識パターンに対する真のクラスの情報が与えられた場合に、各認識パターンに符号を付与する符号付与処理の手順について説明する。

符号付与処理は、符号付与プログラムをコンピュータが実行することによって実現される。図２は、この発明に係る符号を認識パターンに付与する処理をコンピュータに実行させる符号付与プログラムあるいは符号付与装置の機能的な構成例を示すブロック図である。図２に示すように、符号付与プログラムあるいは符号付与装置は、真のカテゴリー取得部に相当し、認識パターンとなる文字の文字コードを取得する文字コード取得部７１、予め前記符号決定処理により決定された符号定義を格納する符号定義格納部７９、符号定義を参照して取得した文字に対して付与すべき符号を決定する符号決定部７３、各文字に対応して決定した符号を文書のページあるいは領域の単位で結合した符号（結合付加情報）を生成して出力する付加情報出力部７７から構成される。

一例として、いわゆるワープロと呼ばれる文書処理ソフトウェアで作成した文書に、文字認識用の符号を印字出力に付与する場合を説明する。パーソナルコンピュータのアプリケーションの一つとして文書処理ソフトがあり、この文書処理ソフトから文書の印字要求がなされる。この文書処理ソフトは、この発明に係る結合付加情報としての二次元バーコードを各ページの印字出力に付加する機能を有する。印字出力時にユーザが設定するメニューには、符号を書くページに付与するか否かの選択肢があり、ユーザは符号を付与することを選択したとする。文書処理ソフトからの印字要求は、ＯＳを介して、指定されたプリンタドライバに伝えられる。また、付加情報を付与する設定がされているので、符号付与プログラムが起動される。符号付与プログラムは、文書処理ソフトと共に提供され、プリンタドライバと共同して働く独立したプログラムであってもよい。あるいはまた、印字データを生成するプリンタドライバの一部として組み込まれていてもよい。

図１８は、符号付与プログラムの処理手順を示すフローチャートである。図１８に示すように、符号付与プログラムを実行するコンピュータは、まず、文字コード取得部７１として文書処理ソフトから出力される文書に含まれる各文字の文字情報を取得する（ステップＳ２０１）。前記文字情報の一形態は、ＪＩＳで規定された文字コードである。文字情報は、各文字が属する真のクラスの情報に対応する。

前記コンピュータは、各文字の文字コード、が入力されると、符号決定部７３として機能し、符号定義格納部７９の符号定義を参照して文字コードに対応付けられた符号を取得する（ステップＳ２０３）。取得する符号は、前述の符号決定プログラムにより決定されたものであり、コンピュータは、符号定義格納部に格納された符号定義のテーブルを参照して、それぞれの文字に対して付加すべき符号を決定する。そして、決定した符合を一時的な記憶領域に格納する（ステップＳ２０５）。

そして、コンピュータは、文書のページに含まれる全ての文字についての符号を取得したかどうかを次に判定する（ステップＳ２０７）。残りの文字がある場合、ルーチンはＳ２０１へ進み、次の文字コードいついて処理を繰り返し、対応する符号を決定する。一方、ページ内の全ての文字の処理が終了したら、前記コンピュータは結合付加情報出力部７７として、取得した一連の符号に基づいて文書画像に対応する結合付加情報を生成する（ステップＳ２０９）。結合付加情報の一態様は、二次元バーコードの一種であるＱＲコードであるが、これに限定されず、複数の符号の並びを表現でき、画像として出力できるものであればよい。

符号付与プログラムは、出力したＱＲコードを、文書画像内の各パターンとは別に、好ましくはページの隅に印字されるような処理をコンピュータに実行させる（ステップＳ２１１）。あるいは、結合付加情報は、各パターンに対応する位置に分散して配置されるパターンであってもよい。一般に文書画像の印字データは、ページ単位で生成される。この場合、符号付与プログラムは、各ページに含まれる全ての文字対応する符号をまとめて結合付加情報として出力することが好ましい。そして、文書の最終ページまで処理を繰り返す（ステップＳ２１３）。

符号付与プログラムが、プリンタドライバと独立したプログラムの場合、符号付与プログラムは、その出力である結合付加情報をプリンタドライバに渡す処理をコンピュータに実行させる。プリンタドライバは、結合付加情報を文書画像に重畳して印字データを生成する。

符号付与処理を実行するハードウェアとしては、汎用のコンピュータ、例えばパーソナルコンピュータを用いることができる。前記パーソナルコンピュータに符号付与プログラムをインストールすることによって認識パターンに符号を付与する処理が実行される。ただし、ハートウェアは、パーソナルコンピュータに限定されるものではなく、例えば、大型コンピュータや携帯情報端末であってもよく、あるいは、デジタル複合機など、印字データを受けて画像を出力する画像形成装置であってもよい。また、情報付与プログラムは、符号決定プログラムと同じハードウェア上で実行されてもよいが、別のハードウェア上で処理されてもよい。

次に、この発明に係る認識方法で、付加情報が付与された文書画像を認識するパターン認識処理について説明する。
この発明に係るパターン認識処理は、付加情報が付与された文書画像をスキャナなどで読み取り、読み取った画像データを認識対象として、コンピュータがパターン認識プログラムを実行することによって実現される。

図３は、パターン認識処理を行う符号付与プログラムあるいはパターン認識装置の機能的な構成例を示すブロック図である。図３に示すように、パターン認識プログラムあるいはパターン認識装置は、パターンデータ取得部に相当し、スキャナなどで読み取った文書画像データを取得する文書画像読取部９１と、文書画像データから認識すべき各文字の領域と例えばＱＲコードなどの結合付加情報の領域とを抽出するパターン抽出部９３と、抽出された結合付加情報のパターンから各認識パターンに対応する符号を復元して取得する符号解析部９９と、混同行列格納部に相当し、ＣＭを予め格納するＣＭ格納部９５と、認識部に相当し、各文字パターンをパターン認識し、パターン認識の結果と復元された符号に基づき、ＣＭを参照して認識パターンが属するクラス、即ち、文字パターンに対応する文字コードを判定する文字認識部９７と、文字認識部９７が判定した文字コードを認識結果として出力する認識結果出力部９６とから構成される。

図１９は、パターン認識プログラムの処理手順を示すフローチャートである。図１９に示すように、パターン認識プログラムを実行するコンピュータは、まず文書画像読取部９１として機能し、スキャナなどの文書画像読取部で読み取った文書画像データを取得する（ステップＳ３０１）。次に、パターン抽出部９３として、取得した画像データを領域分離処理し、認識すべき各文字と各ページに付与されたＱＲコード、その他の領域、例えばグラフや写真画像の領域に分離する（ステップＳ３０３）。文字は、1文字あるいは1単語の、認識処理の単位領域に分離する。そして、符号解析部９９として、ＱＲコードから、そのページの各文字に対応する符号を復元する（ステップＳ３０５）。

次に、前記コンピュータは、文字認識部９７として機能し、先頭の符号に対応する文字を取得する（ステップＳ３０７）。そして、符号に対応する文字のパターンを認識する。ここで、認識は、例えば、実験例で用いたＳＱＤＦ（Simplified Quadratic Discriminant Function、あるいは簡素化2次識別関数）（参考文献３参照）やユークリッド距離など識別器の認識手法として知られた手法と符号からの情報とを組み合わせて行うが、認識の結果として出力される文字コードを最終的な認識結果とせず、中間段階の候補とする（ステップＳ３０９）。
なお、ここで、ＳＱＤＦとユークリッド距離とは、パターン認識の技術分野で認識したパターンをクラスに分類する方法を表す周知の用語である。
まず、ユークリッド距離について説明すると、認識パターンからそのパターンをよく表すような特徴を抽出して数値に変換することができるとする。この数値を特徴量と呼ぶ。このような特徴量がn個あった場合、このパターンはn個の特徴量によって定められるn次元空間の1点とみなすことができる。あらかじめ、各クラスを代表するn次元空間の1点をクラス毎に計算しておく。このとき、認識パターンを表す点と各クラスを代表する点の距離をｎ次元のユークリッド空間内の距離（ユークリッド距離）として計算し、最も距離が小さくなるクラスに認識パターンを分類する方法をパターン認識では一般に「ユークリッド距離」と呼ぶ。
一方、ＳＱＤＦについては、まず、ＳＱＤＦの基になる２次識別関数について説明しなければならない。２次識別関数の場合、認識パターンがn次元空間の1点で表される点では前述のユークリッド距離と同様であるが、各クラスは点ではなく、正規分布で表される。そして、パターンの識別においては認識パターンを表す点が各クラスの正規分布から生成された確率を計算し、その確率が最も高いクラスに分類する。二次識別関数は、各クラスの正規分布を推定するために用いるサンプル数が十分多ければ、ユークリッド距離やマハラノビス距離と呼ばれる識別器に比べて高性能であるが、サンプル数が不足した場合は性能が劣る。そこで、このような二次識別関数の欠点を補い、計算量と識別精度を改善した方法がＳＱＤＦ（簡素化２次識別関数）である。以上が、ＳＱＤＦとユークリッド距離の説明である。
図１９の説明に戻ると、前記コンピュータは、予めＣＭ格納部９５に格納されたＣＭを参照し、候補とした文字コードの列のＣＭの要素のうち、符号に該当する要素を調べ、リジェクトを行わない場合には最も値の大きい要素の行が属する真のクラスを認識結果の文字コードとする（ステップＳ３１１）。そして、決定した文字コードを認識結果として格納する（ステップＳ３１３）。リジェクトを行う場合には、ここでリジェクトを行う。

次に、前記コンピュータは、符号がそのページの最後の文字に対応するものか否かをしらべ（ステップＳ３１５）、残りの文字があれば、次の文字を取得した後（ステップＳ３１９）ルーチンはステップＳ３０９からの処理を繰り返す。一方、そのページの最終文字であれば、認識結果出力部９６として、そのページの文字についての認識結果を出力する（ステップＳ３１７）。
なお、このフローチャートでは、認識結果をページ毎にまとめて出力するようにしているが、1文字ごとに出力してもよい。また、1ページについての認識手順を示しているが、複数ページを認識する場合は、全てのページについて前述の処理を繰り返せばよい。

（実験例）
実験例１．符号の情報量と認識率、リジェクト率の関係
実際の文字データを認識して得た８種類のＣＭを用い、認識率と、認識率１００％かつリジェクト率０％に必要な情報量を求めた。８種類のＣＭは２種類の文字データ、２種類の識別器、さらにオープン実験とクローズ実験の組み合わせにより作成した。ここで、オープン実験とは、ＣＭの作成に用いた文字データ以外の文字データを認識パターンに用いる実験であり、クローズ実験とは、ＣＭの作成に用いた文字データのみを認識パターンに用いる実験である。

認識パターンとして用いる文字データには手書き文字と印刷文字を用いた。手書き文字の場合は推定されたＣＭには存在しない誤認識が起こる可能性が高く、また、文字パターンと同時に付加情報を与えることが困難なため、この発明に係る認識方式を手書き文字に用いることは主たる用途として想定できないが、参考のために掲載する。

手書き文字はＥＴＬ９Ｂ（３０３６字種、２００セット）を６４×６４の大きさに非線形正規化（参考文献１参照）した後、１９６次元の方向線素特徴量（参考文献２参照）を抽出して用いた。印刷文字は２５種類のフォントからＥＴＬ９Ｂに含まれる３０３６字種のひらがなと漢字を抜き出し、ＥＴＬ９Ｂと同様の処理で特徴量を作成した。

識別器の代表として、ユークリッド距離とＳＱＤＦを用いる識別器を実験に用いた。オープン実験はleave-one-out法で行った。印刷文字のオープン実験は、２４種類のフォントをＣＭの作成に用い、ＣＭの作成に用いなかったフォントを認識する実験を行った。これらの実験条件とそのときの認識率を表１に示す。

注 Euclidean:ユークリッド距離

８種類のＣＭを対象として、パターンとしての各文字に付加する符号の情報量と認識率との関係を図１０の処理ルーチンにより求めた。その結果を図１４、１５に示す。図１４は、リジェクトなしの場合の記号の種類と認識率との関係を示すグラフである。図１４（ａ）は手書き文字、図１４（ｂ）は印刷文字の結果を示す。また、誤認識率を０％に保つことを条件とした場合に付加すべき符号の情報量と必要なリジェクト率の関係を図１０の処理ルーチンにより求めた。図１４は、リジェクトなしの場合の記号の種類と認識率との関係を示すグラフである。図１４、１５は所望の認識率を得るために必要な符号の情報量とリジェクト率を表している。この発明に係る認識方式のようにパターンとは別に付加情報を与える認識系を設計する上で有用である。ただし、図中のグラフは最適解ではないため、達成可能な認識率は図１４より上昇する可能性があり、図１５より小さいリジェクト率で誤認識率０％が達成できる可能性がある。

また、認識率１００％かつリジェクト率０％の達成に必要な情報量と、そのときの記号の種類を表１に示す。なお、３０３６クラス問題が持つ不確かさはlog₂3036≒11.57ビットである。欲張り法では近似解しか得られないが、認識率１００％かつリジェクト率０％の達成に必要な記号の種類は厳密解と同じであった。

以上のようにして決定した符号を各文字に付加し、印刷文字に対してＳＱＤＦを用いた場合、オープン実験では１文字当たり４ビット、クローズ実験では１文字当たり１ビットの情報の付加で認識率１００％かつリジェクト率０％が達成できた。後者はクローズ実験であるが、印刷文字はフォントと利用環境を限定すればＣＭがほぼ正しく求まると考えられるため、実験条件は現実に即したものである。

識別器の認識性能の違いの影響を検討するために、ＳＱＤＦとユークリッド距離を比較すると、認識率ではＳＱＤＦが上回っているが、認識率１００％かつリジェクト率０％に必要な情報量では必ずしもＳＱＤＦは優位ではなかった。これは、実施の形態１の項目２で述べたような誤認識が生じやすいクラスの影響である．ユークリッド距離の認識率はそれ程高くないが、認識誤りに偏りが小さく、認識結果のクラスが比較的分散していた。一方、ＳＱＤＦは認識率が高い反面、オープン実験では多くのクラスが特定のクラスに誤認識される傾向が見られた。これが原因で、ＳＱＤＦは認識率が高いにもかかわらず、認識率を１００％にするために必要な情報量は認識率の低いユークリッド距離よりも大きくなるという逆転現象が起こった。このように付加情報を用いるパターン認識では、従来のように最高の認識率を目指すのではなく、最小の付加情報の情報量を目指す必要がある。つまり、多少認識率は低くても誤認識され易いクラスを生み出しにくい識別器の導出が求められる。
また、実用上は、少数のクラスに支配されてしまう認識率１００％かつリジェクト率０％に必要な情報量よりも、多少のリジェクトを許容して認識率１００％を達成する状況を考えるほうが有益であるとも考えられる。

実験例２．文字コードを伝達する場合との比較
この発明に係る認識方式は前述の通り、通常のパターン認識（図２０（ａ））とコードをそのまま用いる場合（図２０（ｂ））の折衷である。このことは、パターン認識は利用できるが、認識結果が誤りを含む場合に意味を持つ。例えば、文書に書かれたテキスト情報をコンピュータに誤りなく読み込む状況等が該当する。この場合、文字コードをそのまま伝達できる媒体、例えばＱＲコードに埋め込む事で誤りのない情報の読み込みが可能である。しかし、情報量が大きいために、後述するように紙面に対して巨大なＱＲコードが必要となる。一方、提案方式を用いて認識率１００％に必要な情報のみを埋め込めば、ＱＲコードの大きさは随分小さくすることができる。このことを実際にＱＲコードを作成して比較、検証する。ここでは１ページ当たり、日本語のひらがなと漢字が１０００文字含まれるとする。

ＱＲコードは埋め込むことができるデータ量によって１型から４０型に分かれており、それぞれ大きさが異なる。文字コードをそのまま埋め込む場合、前節の実験で対象とした３０３６字種を表すためには１２ビット必要なので、必要な情報量は、
である。一方、文字認識を行う場合には、前節の実験結果から印刷文字のクローズ実験の場合には１文字当たり１ビットの付加情報で済むので、必要な情報量は、
である。

ＱＲコードの基本仕様（ＪＩＳＸ０５１０）によると、レベルＭの誤り訂正能力を持つＱＲコードの「８ビットバイトモード」を使用した場合、１２５バイトのデータを埋め込むことができる最小の型は８型であり、１５００バイトのデータを埋め込むことができる最小の型は３２型である。そこで、８型と３２型のＱＲコードをＷｅｂ上のＱＲコード作成サイトで作成し、図１６に示す。図１６（ａ）は、３２型であり、文字コードに相当する。図１６（ｂ）は、８型であり、認識率１００％に必要な付加情報に相当する。

両者を比較すると、８型は縦、横の大きさが３２型の約１／３、面積が約１／９である。
このように、認識情報が利用できる状況では、この発明に係る認識方式を用いることで、誤りのない情報伝達が比較的小さい情報量の付加で実現可能である。
最後に、前述した実施の形態の他にも、この発明について種々の変形例があり得ることは明らかである。そのような変形例は、この発明の特徴及び範囲に属さないと解釈されるべきものではない。本発明の範囲には、特許請求の範囲と均等の意味および範囲内でのすべての変更とが含まれることが意図される。

参考文献１
山田博三、斉藤泰一、山本和彦、"線密度イコライゼーション−−−相関法のための非線形正規化法" 信学論(D)、 vol.J67-D, no.11, pp.1379-1383, Nov.,1984.
参考文献２
孫寧、田原透、阿曽弘具、木村正行、"方向線素特徴量を用いた高精度文字認識、" 信学論(D-II)、 vol.J74-D-II, no.3, pp.330-339, Mar.,1991.
参考文献３
S.Omachi, F.Sun and H.Aso, "A new approximation method of the quadratic discriminant function, "Lecture Notes in Computer Science, vol.1876, pp.601-610, Sept.,2000.

この発明に係る符号をＣＭに基づいて決定する処理をコンピュータに実行させる符合決定プログラム、あるいは符号決定処理装置の機能的な構成例を示すブロック図である。この発明に係る符合を認識パターンに付与する処理をコンピュータに実行させる符号付与プログラムあるいは符号付与装置の機能的な構成例を示すブロック図である。この発明に係る認識手法において、パターン認識処理を行う符号付与プログラムあるいはパターン認識装置の機能的な構成例を示すブロック図である。この発明に係る混同行列の一例を示す説明図である。この発明に係る認識系の構成を示す説明図である。認識率１００％かつリジェクト率０％を実現する符号として、図４の混同行列に３種類の符号を割り当てた例を示す説明図である。図６の符号の割り当てに対応するグラフを示す説明図である。この発明に係る混同行列の異なる例として、誤認識され易いクラスを含む混同行列の例を示す説明図である。この発明に係る認識手法において、付加情報の情報量が図６より小さい場合であって、リジェクトなしで誤認識を許容する場合の符号の例を示す説明図である。この発明に係る認識手法において、損失最小を目指す欲張り法の処理ルーチンの実行手順を示す説明図である。図１０の処理ルーチンを図４に適用し、リジェクトなしで誤認識を許容する場合の符号を求めたときの符号と損失Ｌ₁の推移を示す説明図である。この発明に係る認識手法において、付加情報の情報量が図６より小さい場合であって、リジェクトを許容して誤認識を避ける場合の符号の例を示す説明図である。図１０の処理ルーチンを図４に適用し、リジェクトを許容して誤認識を避ける場合の符号を求めたときの符号と損失Ｌ₂の推移を示す説明図である。この発明に係る認識手法において、リジェクトなしの場合の記号の種類と認識率との関係を示すグラフである。この発明に係る認識手法において、誤認識率０％の場合の記号の種類と認識率との関係を示すグラフである。この発明に係る認識手法において、１ページ（1000文字）の日本語の文章を表すために必要なＱＲコードの例を示す説明図である。この発明の認識手法において、コンピュータが実行する符号決定プログラムの処理手順を示すフローチャートである。この発明の認識手法において、コンピュータが実行する符号付与プログラムの処理手順を示すフローチャートである。この発明の認識手法において、コンピュータが実行するパターン認識プログラムの処理手順を示すフローチャートである。従来の認識と情報伝達のモデルを示す説明図である。

符号の説明

５１目標性能設定処理部
５３符号定義処理部
５５符号定義出力部
５７ＣＭデータ入力処理部

Claims

パターンから抽出した特徴に基づいて、複数のカテゴリーのうちそのパターンが属すべき一つのカテゴリーを出力し得る識別器からの出力と、前記識別器の認識誤りを補うために前記パターンに予め付加される付加情報とに基づいて前記パターンが属すべき正解カテゴリーを決定するために十分な情報量を有するパターン認識用付加情報の決定方法であって、
それぞれのカテゴリーに属すべき複数のパターンが前記識別器によりパターン認識されたときにそれらのパターンが正解カテゴリーおよびその他の各不正解カテゴリーに属すると判定される確率を要素とする混同行列を取得する工程と、
前記識別器の認識誤りを付加情報で補うことにより実現すべき認識性能として認識率またはリジェクト率の指定を受付ける工程と、
前記認識性能に応じて各パターンに付加すべき付加情報を決定する符号定義工程と、
決定された付加情報を出力する工程とを備え、
各工程をコンピュータが実行し、
前記符号定義工程は、前記混同行列を参照し、異なるカテゴリーに同じ符号を割り当てても前記認識性能を満足する限りにおいて各カテゴリーを組み合わせて複数の区分にまとめ、各区分に識別子を付与し、各パターンにつき正解カテゴリーを含む区分に付与された識別子をそのパターンの付加情報とすることを特徴とする方法。
前記認識性能として認識率が指定され、
前記混同行列は、縦方向の各行が各パターンの正解カテゴリーに対応し、横方向の各列が前記識別器による各パターンの認識結果として正解カテゴリーおよび各不正解カテゴリーに属すると判定される確率に対応し、
前記符号定義工程は、区分の数を現在より１つ減らすように前記混同行列に係る各カテゴリーを縦方向に組み合わせてみて、ある列において同じ区分に属することになる要素から最大のものを除いて残る要素の合計をその列に係る前記区分の誤認識率として試算し、試算された誤認識率の列を通しての和が最小になる組み合わせに各カテゴリーをまとめる請求項１記載の方法。
前記認識性能としてリジェクト率が指定され、
前記混同行列は、縦方向の各行が各パターンの正解カテゴリーに対応し、横方向の各列が前記識別器による各パターンの認識結果として正解カテゴリーおよび各不正解カテゴリーに属すると判定される確率に対応し、
前記符号定義工程は、区分の数を現在より１つ減らすように前記混同行列に係る各カテゴリーを縦方向に組み合わせてみて、ある列において同じ区分に属することになる要素のうちゼロでないものの数が１以下ならゼロ値を、複数なら前記要素の和の値を、その列に係る前記区分の重み値として試算し、試算された重み値の列を通しての和が最小になる組み合わせに各カテゴリーをまとめる請求項１記載の方法。
パターンから抽出した特徴に基づいて、複数のカテゴリーのうちそのパターンが属すべき一つのカテゴリーを出力し得る識別器からの出力と、前記識別器の認識誤りを補うために前記パターンに予め付加される付加情報とに基づいて前記パターンが属すべき正解カテゴリーを決定するために十分な情報量を有するパターン認識用付加情報の決定処理をコンピュータに実行させるためのプログラムであって、
それぞれのカテゴリーに属すべき複数のパターンが前記識別器によりパターン認識されたときにそれらのパターンが正解カテゴリーおよびその他の各不正解カテゴリーに属すると判定される確率を要素とする混同行列を取得する混同行列取得部と、
前記識別器の認識誤りを付加情報で補うことにより実現すべき認識性能として認識率またはリジェクト率の指定を受付ける目標性能入力部と、
前記認識性能に応じて各パターンに付加すべき付加情報を決定する符号定義部と、
決定された付加情報を出力する符号定義出力部としての機能をコンピュータに実行させ、
前記符号定義部は、前記混同行列を参照し、異なるカテゴリーに同じ符号を割り当てても前記認識性能を満足する限りにおいて各カテゴリーを組み合わせて複数の区分にまとめ、各区分に識別子を付与し、各パターンにつき正解カテゴリーを含む区分に付与された識別子をそのパターンの付加情報とすることを特徴とするプログラム。
前記認識性能として認識率が指定され、
前記混同行列は、縦方向の各行が各パターンの正解カテゴリーに対応し、横方向の各列が前記識別器による各パターンの認識結果として正解カテゴリーおよび各不正解カテゴリーに属すると判定される確率に対応し、
前記符号定義部は、区分の数を現在より１つ減らすように前記混同行列に係る各カテゴリーを縦方向に組み合わせてみて、ある列において同じ区分に属することになる要素から最大のものを除いて残る要素の合計をその列に係る前記区分の誤認識率として試算し、試算された誤認識率の列を通しての和が最小になる組み合わせに各カテゴリーをまとめる請求項４記載のプログラム。
前記認識性能としてリジェクト率が指定され、
前記混同行列は、縦方向の各行が各パターンの正解カテゴリーに対応し、横方向の各列が前記識別器による各パターンの認識結果として正解カテゴリーおよび各不正解カテゴリーに属すると判定される確率に対応し、
前記符号定義部は、区分の数を現在より１つ減らすように前記混同行列に係る各カテゴリーを縦方向に組み合わせてみて、ある列において同じ区分に属することになる要素のうちゼロでないものの数が１以下ならゼロ値を、複数なら前記要素の和の値を、その列に係る前記区分の重み値として試算し、試算された重み値の列を通しての和が最小になる組み合わせに各カテゴリーをまとめる請求項４記載のプログラム。
パターンから抽出した特徴に基づいて、複数のカテゴリーのうちそのパターンが属すべき一つのカテゴリーを出力し得る識別器からの出力と、前記識別器の認識誤りを補うために前記パターンに予め付加される付加情報とに基づいて前記パターンが属すべき正解カテゴリーを決定するために十分な情報量を有するパターン認識用付加情報の付与プログラムであって、
パターンが属すべき正解カテゴリーを取得する正解カテゴリー取得部と、
請求項４記載の付加情報の決定処理用プログラムを用いて決定された符号定義を格納する符号定義格納部と、
パターンの正解カテゴリーに対応する符号を符号定義に基づいて決定する符号決定部と、決定された符合を付加情報として出力する付加情報出力部としての機能をコンピュータに実行させることを特徴とするプログラム。
パターンから抽出した特徴に基づいて、複数のカテゴリーのうちそのパターンが属すべき一つのカテゴリーを出力し得る識別器からの出力と、前記識別器の認識誤りを補うために前記パターンに予め付加される付加情報とに基づいて複数のカテゴリーから各パターンが属する正解カテゴリーを決定する認識手法に係るパターン認識処理をコンピュータに実行させるパターン認識用プログラムであって、
請求項４記載のプログラムにより決定された区分の識別子が付加情報として予め付されたパターンのデータを取得するパターンデータ取得部と、
取得したデータから、認識すべきパターンと付加情報とを抽出するパターン抽出部と、
それぞれのカテゴリーに属すべき複数のパターンが前記識別器によりパターン認識されたときにそれらのパターンが正解カテゴリーおよびその他の各不正解カテゴリーに属すると判定される確率を要素とする行列であって、予め提供された混同行列を格納する混同行列格納部と、
識別器を用いて前記パターンを認識して少なくとも一つの正解候補を得る認識部と、
前記正解候補に付された識別子に基づいて正解カテゴリーが含まれる区分を決定し、その区分に属する混同行列中の要素のうち最大の要素が含まれるカテゴリーを正解カテゴリーとして決定する符号解析部と、
決定された正解カテゴリーを出力する認識結果出力部としての機能を実行させることを特徴とするプログラム。
パターンから抽出した特徴に基づいて、複数のカテゴリーのうちそのパターンが属すべき一つのカテゴリーを出力し得る識別器からの出力と、前記識別器の認識誤りを補うために前記パターンに予め付加される付加情報とに基づいて前記パターンが属すべき正解カテゴリーを決定するために十分な情報量を有するパターン認識用付加情報を決定する装置であって、
それぞれのカテゴリーに属すべき複数のパターンが前記識別器によりパターン認識されたときにそれらのパターンが正解カテゴリーおよびその他の各不正解カテゴリーに属すると判定されるそれぞれの確率を要素とする混同行列を取得する混同行列取得部と、
前記識別器の認識誤りを付加情報で補うことにより実現すべき認識性能として認識率またはリジェクト率の指定を受付ける目標性能入力部と、
前記認識性能に応じて各パターンに付加すべき付加情報を決定する符号定義部と、
決定された付加情報を出力する符号定義出力部とを備え、
前記符号定義部は、前記混同行列を参照し、異なるカテゴリーに同じ符号を割り当てても前記認識性能を満足する限りにおいて各カテゴリーを組み合わせてなる複数の区分にまとめて各区分に識別子を付与し、各パターンにつき正解カテゴリーを含む区分に付与された識別子をそのパターンの付加情報とすることを特徴とする装置。
前記認識性能として認識率が指定され、
前記混同行列は、縦方向の各行が各パターンの正解カテゴリーに対応し、横方向の各列が前記識別器による各パターンの認識結果として正解カテゴリーおよび各不正解カテゴリーに属すると判定される確率に対応し、
前記符号定義部は、区分の数を現在より１つ減らすように前記混同行列に係る各カテゴリーを縦方向に組み合わせてみて、ある列において同じ区分に属することになる要素から最大のものを除いて残る要素の合計をその列に係る前記区分の誤認識率として試算し、試算された誤認識率の列を通しての和が最小になる組み合わせに各カテゴリーをまとめる請求項９記載の装置。
前記認識性能としてリジェクト率が指定され、
前記混同行列は、縦方向の各行が各パターンの正解カテゴリーに対応し、横方向の各列が前記識別器による各パターンの認識結果として正解カテゴリーおよび各不正解カテゴリーに属すると判定される確率に対応し、
前記符号定義部は、区分の数を現在より１つ減らすように前記混同行列に係る各カテゴリーを縦方向に組み合わせてみて、ある列において同じ区分に属することになる要素のうちゼロでないものの数が１以下ならゼロ値を、複数なら前記要素の和の値を、その列に係る前記区分の重み値として試算し、試算された重み値の列を通しての和が最小になる組み合わせに各カテゴリーをまとめる請求項９記載の装置。
パターンから抽出した特徴に基づいて、複数のカテゴリーのうちそのパターンが属すべき一つのカテゴリーを出力し得る識別器からの出力と、前記識別器の認識誤りを補うために前記パターンに予め付加される付加情報とに基づいて前記パターンが属すべき正解カテゴリーを決定するために十分な情報量を有するパターン認識用付加情報の付与装置であって、
パターンが属すべき正解カテゴリーを取得する正解カテゴリー取得部と、
請求項９記載の付加情報決定用装置を用いて決定された符号定義を格納する符号定義格納部と、
パターンの正解カテゴリーに対応する符号を符号定義に基づいて決定する符号決定部と、決定された符合を付加情報として出力する付加情報出力部とを備えることを特徴とする装置。
パターンから抽出した特徴に基づいて、複数のカテゴリーのうちそのパターンが属すべき一つのカテゴリーを出力し得る識別器からの出力と、前記識別器の認識誤りを補うために前記パターンに予め付加される付加情報とに基づいて複数のカテゴリーから各パターンが属する正解カテゴリーを決定する認識手法に係るパターン認識用装置であって、
請求項９記載の装置により決定された区分の識別子が付加情報として予め付されたパターンのデータを取得するパターンデータ取得部と、
取得したデータから、認識すべきパターンと付加情報とを抽出するパターン抽出部と、
それぞれのカテゴリーに属すべき複数のパターンが前記識別器によりパターン認識されたときにそれらのパターンが正解カテゴリーおよびその他の各不正解カテゴリーに属すると判定される確率を要素とする行列であって、予め提供された混同行列を格納する混同行列格納部と、
識別器を用いて前記パターンを認識して少なくとも一つの正解候補を得る認識部と、
前記正解候補に付された識別子に基づいて正解カテゴリーが含まれる区分を決定し、その区分に属する混同行列中の要素のうち最大の要素が含まれるカテゴリーを正解カテゴリーとして決定する符号解析部と、
決定された正解カテゴリーを出力する認識結果出力部としての機能を実行させることを特徴とする装置。