JP6798055B1

JP6798055B1 - 情報処理装置、情報処理方法、プログラムおよび順序情報

Info

Publication number: JP6798055B1
Application number: JP2020052183A
Authority: JP
Inventors: 遼平田中
Original assignee: Toshiba Corp; Toshiba Digital Solutions Corp
Current assignee: Toshiba Corp; Toshiba Digital Solutions Corp
Priority date: 2020-03-24
Filing date: 2020-03-24
Publication date: 2020-12-09
Anticipated expiration: 2040-03-24
Also published as: WO2021192818A1; JP2021152689A; CN115298707A; US20230005282A1

Abstract

【課題】メタ情報を用いる文字認識処理の認識精度を向上させる。【解決手段】実施形態の情報処理装置は、記憶部と、認識部と、更新部と、を備える。記憶部は、認識対象とする文字に対する複数のメタ情報間の順序を定めた順序情報を記憶する。認識部は、複数のメタ情報のうち指定された第１メタ情報を用いて、文字列を含む画像に対して文字認識を実行する。更新部は、文字認識の確信度が予め定められた条件を満たす場合に、順序情報に従って、第１メタ情報を第２メタ情報に更新する。認識部は、更新された第２メタ情報を用いて文字認識を実行する。【選択図】図１

Description

本発明の実施形態は、情報処理装置、情報処理方法、プログラムおよび順序情報に関する。

文字列画像を入力とし、尤もらしい文字列を予測する文字列認識では、文字列画像に付帯する情報を考慮することで認識精度を向上させる手法が提案されている。例えば、帳票画像の認識の場合、住所フィールド、日付フィールド、および、氏名フィールドといったフィールドタイプごとに異なる認識処理を施すことで、より正確な認識が実現される。フィールドタイプは、例えば、文字列画像に付帯するメタ情報として文字認識システムへ入力される。メタ情報は、同形文字の識別、および、認識結果として取りうる文字を絞るために用いられる。

特開２０１９−０７９３４７号公報

しかしながら、従来技術では、メタ情報が間違っている場合、および、メタ情報が想定していない画像が入力された場合、認識精度が低下する可能性があった。

実施形態の情報処理装置は、記憶部と、認識部と、更新部と、を備える。記憶部は、認識対象とする文字に対する複数のメタ情報間の順序を定めた順序情報を記憶する。認識部は、複数のメタ情報のうち指定された第１メタ情報を用いて、文字列を含む画像に対して文字認識を実行する。更新部は、文字認識の確信度が予め定められた条件を満たす場合に、順序情報に従って、第１メタ情報を第２メタ情報に更新する。認識部は、更新された第２メタ情報を用いて文字認識を実行する。

図１は、第１の実施形態にかかる情報処理装置の構成の一例を示すブロック図である。図２は、順序情報のデータ構造の一例を示す図である。図３は、記憶部に記憶される順序情報のデータ構造の一例を示す図である。図４は、第１の実施形態における認識処理の一例を示すフローチャートである。図５は、メタ情報の指定するためのＧＵＩの一例を示す図である。図６は、順序情報のデータ構造の一例を示す図である。図７は、第２の実施形態にかかる情報処理装置の構成の一例を示すブロック図である。図８は、第２の実施形態の順序情報のデータ構造の一例を示す図である。図９は、第２の実施形態における認識処理の一例を示すフローチャートである。図１０は、第３の実施形態にかかる情報処理装置の構成の一例を示すブロック図である。図１１は、第３の実施形態における修正処理の一例を示すフローチャートである。図１２は、修正した順序情報の例を示す図である。図１３は、第４の実施形態にかかる情報処理装置の構成の一例を示すブロック図である。図１４は、第４の実施形態における推定処理の一例を示すフローチャートである。図１５は、第１から第４の実施形態にかかる情報処理装置のハードウェア構成例を示す説明図である。

以下に添付図面を参照して、この発明にかかる情報処理装置の好適な実施形態を詳細に説明する。

（第１の実施形態）
メタ情報を用いた認識精度の低下は、以下のような場合に生じうる。例えばカタカナ名フィールドに「マイケル」と記入され、メタ情報として「カタカナ名」が指定されたとする。しかし、カタカナ名に紐づけられた認識処理が「マイケル」のような外国人の名前を想定していなかった場合、認識精度が低下する。

そこで、第１の実施形態では、複数のメタ情報間の順序を定めるように、メタ情報を予め構造化する。そして第１の実施形態では、指定されたメタ情報（以下、指定メタ情報という）で認識結果の確信度が低い場合に、順序に従って更新したメタ情報を用いて文字認識を再実行する。これにより、より精度の高い認識結果を得ることが可能となる。

図１は、第１の実施形態にかかる情報処理装置１００の構成の一例を示すブロック図である。図１に示すように、情報処理装置１００は、表示部１１１と、記憶部１２１と、受付部１０１と、認識部１０２と、更新部１０３と、出力制御部１０４と、を備えている。

表示部１１１は、情報処理装置１００により処理される各種情報を出力する出力装置の一例である。表示部１１１は、例えば、ディスプレイなどの情報を表示する表示装置である。情報を出力する出力装置は、表示部１１１（表示装置）に限られず、どのような装置であってもよい。例えば、出力装置は、インターネットなどのネットワーク（有線、無線を問わない）を介して接続される他の情報処理装置であってもよい。

記憶部１２１は、情報処理装置１００により処理される各種情報を記憶する記憶媒体である。例えば記憶部１２１は、認識対象とする文字に対する複数のメタ情報間の順序を定めた順序情報を記憶する。記憶部１２１は、フラッシュメモリ、メモリカード、ＲＡＭ（Random Access Memory）、ＨＤＤ（Hard Disk Drive）、および、光ディスクなどの一般的に利用されているあらゆる記憶媒体により構成することができる。

ここで、順序情報のデータ構造について説明する。図２は、順序情報のデータ構造の一例を示す図である。図２の順序情報は、複数のメタ情報それぞれをノードとし、有向エッジでノード間を接続した有向非巡回グラフで表される例である。なお順序情報のデータ構造は、有向非巡回グラフに限られない。

有向非巡回グラフとは、ノードと、方向を持つエッジと、を含む有向グラフのうち、閉じた回路を持たないグラフ構造である。すなわち有向非巡回グラフでは、いずれのノードから出発してエッジを辿っても、再び同じノードに戻ることはない。以下では、有向エッジで接続される２つのノードのうち、接続元（始点）となるノードを始点ノードと呼び、有向エッジが指し示すノード（終点となるノード、接続先となるノード）を終点ノードと呼ぶ。有向非巡回グラフのノードのうち、いずれのノードの接続元（始点）でも無いノードを先端ノードと呼び、いずれのノードの接続先（終点）でもないノードを末端ノードと呼ぶ。

図２の順序情報は、末端ノードに近いメタ情報ほど、メタ情報の表す集合が細分化されるような有向非巡回グラフとして表した例である。順序情報は、先端ノードに近いメタ情報ほど、メタ情報の表す集合が細分化されるような有向非巡回グラフであってもよい。

図２の有向非巡回グラフは、「指定なし」、「住所」、「英数記号」、「カタカナ」、「英単語」、「数字」、「カタカナ姓」、および、「カタカナ名」がフィールドタイプを示すメタ情報として定義されたノードを含む。有向エッジで接続された２つのメタ情報に注目したとき、始点ノードのメタ情報が、終点ノードのメタ情報の部分集合を表すように有向非巡回グラフが定義される。

例えば図２の場合、先端ノードは、フィールドタイプが「指定なし」であり、フィールドタイプに仮定を置かない最も大きい集合（全集合）を表す。「指定なし」を終点とするノードに対応する「住所」、「英数記号」、「カタカナ」は、「指定なし」の部分集合に相当する。「英数記号」を終点とするノードに対応する「英単語」、「数字」は、「英数記号」の部分集合に相当する。「カタカナ」を終点とするノードに対応する「カタカナ性」、「カタカナ名」は、「カタカナ」の部分集合に相当する。このように、末端ノードに近いほどメタ情報の表す集合が細分化される。

図３は、記憶部１２１に記憶される順序情報のデータ構造の一例を示す図である。図３に示すように、記憶部１２１は、有向非巡回グラフを構成するすべてのノードについて各ノードの接続先となるノード（終点ノード）を記載したテーブルの形式で有向非巡回グラフを記憶する。なお、図３のデータ構造は一例であり、他の構造により順序情報が記憶されてもよい。

図１に戻り、他の機能について説明する。

受付部１０１は、情報処理装置１００で用いられる各種情報の入力を受け付ける。例えば受付部１０１は、認識処理の対象となる画像（文字列を含む画像）を受け付ける。受付部１０１による各データの受付方法は、どのような方法であってもよい。例えば、外部装置からネットワークを介して取得する方法、および、記憶媒体に記憶されたデータを読み込む方法などを適用できる。ネットワークは、ＬＡＮ（ローカルエリアネットワーク）、および、インターネットなどであるが、その他のどのようなネットワークであってもよい。またネットワークは、有線ネットワークおよび無線ネットワークのいずれであってもよい。

また、受付部１０１は、例えばユーザにより指定されたメタ情報を受け付ける。ユーザによる情報の指定方法はどのような方法であってもよいが、例えばキーボード、マウスなどの入力装置を用いて指定する方法を適用できる。

認識部１０２は、文字列を含む画像に対する文字認識を実行する。認識部１０２は、指定されたメタ情報を用いて、メタ情報に応じた文字認識を実行する。例えばメタ情報（フィールドタイプ）が「指定なし」の場合、認識部１０２は、すべての字種および文字の並びを取りうることを想定して文字認識を実行する。メタ情報が「カタカナ」の場合、認識部１０２は、字種をカタカナに限定して文字認識を実行する。また、メタ情報が「カタカナ姓」の場合、認識部１０２は、カタカナ性に相当する並びとなる文字列に限定して文字認識を実行する。適切なメタ情報が指定されれば、認識精度を高めることができる。

メタ情報に応じて認識処理を切り替える方法はどのような方法であってもよいが、例えば以下の（Ｍ１）から（Ｍ３）の３つの方法を適用できる。
（Ｍ１）メタ情報ごとに文字列認識モデルを用意する。文字列認識モデルは、例えばニューラルネットワークおよび隠れマルコフモデル（ＨＭＭ：Hidden Markov Model）である。
（Ｍ２）字形の認識にはメタ情報によらない共通のアルゴリズムを用いて複数の候補を推定し、事後的な文字列候補の選択時にメタ情報によって異なる順位付け処理を行う。
（Ｍ３）文字列画像に加えてメタ情報をベクトルとして入力可能な文字列認識モデルを用いる。例えばメタ情報と文字列画像とを入力し、認識結果を出力するニューラルネットワークを文字列認識モデルとして用いることができる。

メタ情報をベクトルに変換するには、例えばワンホットベクトルを用いればよい。ワンホットベクトルは、例えば該当ノードの次元番号に対応する次元のみ「１」となり、他の次元は「０」となり、次元数がノード数と同じとなるベクトルである。次元番号は、例えば図３のように各ノードに一意な識別情報として割り当てられる番号である。図３のグラフ構造の場合、「カタカナ姓」を表すベクトルは（０，０，０，０，０，０，１，０）^Ｔとなる。

更新部１０３は、順序情報で定められる順序に従ってメタ情報を更新する。例えば更新部１０３は、指定されたメタ情報（第１メタ情報）を用いた認識部１０２による文字認識の確信度が予め定められた条件を満たす場合に、順序情報に従って、指定されたメタ情報を他のメタ情報（第２メタ情報）に更新する。より具体的には、更新部１０３は、指定されたメタ情報を、このメタ情報から有向エッジで接続されるメタ情報に更新する。

予め定められた条件は、例えば確信度が閾値以上となる条件である。条件は、これに限られず、例えば、確信度が小さいと判定できるような他の条件を用いてもよい。例えば、確信度が最良である認識結果と、確信度が２番目である認識結果との間の確信度の差分が閾値以下であるという条件が用いられてもよい。

出力制御部１０４は、情報処理装置１００による各種情報の出力を制御する。例えば出力制御部１０４は、認識結果を、表示部１１１、および、この認識結果を使用する他の装置などに出力する。また出力制御部１０４は、順序情報が定める順序に従いメタ情報を表示部１１に表示する機能を備えてもよい（詳細は後述）。

上記各部（受付部１０１、認識部１０２、更新部１０３、および、出力制御部１０４）は、例えば、１または複数のプロセッサにより実現される。例えば上記各部は、ＣＰＵ（Central Processing Unit）などのプロセッサにプログラムを実行させること、すなわちソフトウェアにより実現してもよい。上記各部は、専用のＩＣ（Integrated Circuit）などのプロセッサ、すなわちハードウェアにより実現してもよい。上記各部は、ソフトウェアおよびハードウェアを併用して実現してもよい。複数のプロセッサを用いる場合、各プロセッサは、各部のうち１つを実現してもよいし、各部のうち２以上を実現してもよい。

次に、このように構成された第１の実施形態にかかる情報処理装置１００による認識処理について説明する。図４は、第１の実施形態における認識処理の一例を示すフローチャートである。

受付部１０１は、認識対象となる画像、および、メタ情報を受け付ける（ステップＳ１０１）。認識部１０２は、受け付けられた画像およびメタ情報に対して文字認識を実行し、尤もらしい文字列と、その文字列の確信度とを予測して出力する（ステップＳ１０２）。認識部１０２は、確信度が閾値以上であるか否かを判定する（ステップＳ１０３）。

なお、閾値は予め定められた一定値であってもよいし、規則に従って変更される値であってもよい。規則は、例えば、メタ情報を更新して（後述のステップＳ１０７）ステップＳ１０２の文字認識を実行するごとに、閾値を増加させる規則などである。増加させる規則は、例えば、文字認識を実行するごとに所定の倍率（例えば１．１倍）を乗じて増加させる規則、および、文字認識を実行するごとに所定の値を加算する規則などを適用できる。

確信度が閾値以上の場合（ステップＳ１０３：Ｙｅｓ）、認識部１０２は、予測した文字列を認識結果として出力し（ステップＳ１０４）、認識処理を終了する。確信度が閾値以上でない場合（ステップＳ１０３：Ｎｏ）、認識部１０２は、予測した確信度および文字列（認識結果）を記憶部１２１に記憶する（ステップＳ１０５）。

更新部１０３は、指定されたメタ情報（文字認識に用いたメタ情報）の接続先があるか否かを判定する（ステップＳ１０６）。例えば更新部１０３は、順序情報を参照し、指定されたメタ情報が先端ノードである場合に、接続先がないと判定する。接続先がない場合（ステップＳ１０６：Ｎｏ）、更新部１０３は、これまで記憶部１２１に記憶された認識結果の中から確信度が最良の認識結果を出力し（ステップＳ１０７）、認識処理を終了する。

接続先がある場合（ステップＳ１０６：Ｙｅｓ）、更新部１０３は、順序情報に従いメタ情報を更新する（ステップＳ１０８）。例えば更新部１０３は、メタ情報を、順序情報で定められた接続先のノードに相当するメタ情報に更新する。図２および図３に示すような順序情報の場合、メタ情報は、より大きい集合に属するメタ情報に更新される。

この後、ステップＳ１０２に戻り、更新されたメタ情報を用いて認識部１０２による文字認識が再度実行される。

ステップＳ１０７で出力する認識結果は、確信度のみでなく、他の要素を考慮して決定されてもよい。例えば、更新部１０３は、確信度に加えて、文字認識（ステップＳ１０２）の繰り返し数を評価指標に加え、繰り返し数がより少なく、かつ、より良い確信度を持った認識結果を選択して出力してもよい。また例えば更新部１０３は、記憶された認識結果の中で最頻の認識結果を選択して出力してもよい。

以下、認識処理の具体例を説明する。認識対象とする画像は文字列「マイケル」を含む文字列画像であり、指定されたメタ情報は「カタカナ名」であり、確信度の閾値は「０．５」であるとする。また、メタ情報が「カタカナ名」の場合、日本語の名である「マイコ」は想定されているが、外国語の名である「マイケル」が想定外であるとする。一方、メタ情報が「カタカナ」の場合、「マイケル」が想定されているとする。

上記前提で１回目の文字認識（ステップＳ１０２）で、認識結果が「マイコ」であり、確信度が「０．３」であったとする。この場合、確信度が閾値以下であるため（ステップＳ１０３：Ｎｏ）、メタ情報は「カタカナ名」の接続先である「カタカナ」に更新される（ステップＳ１０８）。更新後のメタ情報で再度文字認識（ステップＳ１０２）を実行し、認識結果が「マイケル」であり、確信度が「０．８」であったとする。確信度が閾値以上となったため（ステップＳ１０３：Ｙｅｓ）、「マイケル」が認識結果として出力される（ステップＳ１０４）。

本実施形態を適用しない場合は、例えば、指定されたメタ情報である「カタカナ名」に従った文字認識により確信度が低い「マイコ」が認識結果として出力される。これに対して本実施形態を適用すれば、メタ情報を「カタカナ」に更新して文字認識を再度実行できるため、より確信度が高い「マイケル」を認識結果として出力することが可能となる。

認識処理で使用するメタ情報は、例えばユーザにより指定される。出力制御部１０４は、ユーザにより指定可能とするメタ情報を、順序情報に従って表示してもよい。図５は、メタ情報の指定するためのＧＵＩ（Graphical User Interface）の一例を示す図である。

例えば出力制御部１０４は、以下の手順で逐次的にメタ情報を表示する。まず出力制御部１０４は、記憶部１２１に記憶された有向非巡回グラフの先端ノード、すなわち接続先のないノードにあたるメタ情報を表示する。表示されたメタ情報の１つがユーザにより選択されたとき、出力制御部１０４は、選択されたメタ情報に接続するメタ情報をさらに表示する。以下、ユーザの選択に応じて同様の処理が繰り返される。

先端ノードが１つのみの場合、先端ノードが選択されることは明らかなため、先端ノードに接続されるノードも表示してもよい。図５は、先端ノードに対応するメタ情報「指定なし」と、先端ノードに接続するノードに対応する３つのメタ情報「住所」、「英数記号」、「カタカナ」と、が最初に表示される例が示されている。また図５は、「カタカナ」が選択されたことに応じて、「カタカナ」に接続されるノードに対応する２つのメタ情報「カタカナ姓」、「カタカナ名」がさらに表示される例が示されている。

ユーザによる選択方法はどのような方法であってもよいが、例えば、メタ情報をクリックする方法、および、メタ情報にポインタを合わせる方法（マウスオーバーなど）などを適用できる。

このように階層的に整理してメタ情報を表示することで、メタ情報の数が多くグラフ構造が複雑な場合でも、ユーザによるメタ情報の選択をより容易にすることができる。

これまでは、フィールドタイプをメタ情報とする例を説明したが、メタ情報はこれ以外のどのような情報であってもよい。例えば、手書き、および、活字などの字形をメタ情報としてもよい。図６は、字形をメタ情報とする場合の順序情報のデータ構造の一例を示す図である。

図６では、「手書き」の部分集合として「筆記者Ａ」、「筆記者Ｂ」など筆記者を示すメタ情報を設定し、「活字」の部分集合として「ゴシック体」、「明朝体」などのフォントを示すメタ情報を設定する例が示されている。

（変形例１）
メタ情報を示す順序情報は、１つのみでなく、Ｎ個以上（Ｎは２以上の整数）であってもよい。例えば、図２（図３）に示す順序情報と、図６に示す順序情報との２つの順序情報が用いられてもよい。この場合、記憶部１２１は、２種類のメタ情報（フィールドタイム、字形）にそれぞれ対応する、有向非巡回グラフで表された２つの順序情報を記憶する。

認識部１０２は、２つのメタ情報に応じた認識処理を行う。図２（フィールドタイプ）および図６（字形）の２つの順序情報を用いる場合、８つのフィールドタイプと７つの字形との組み合わせである５６通りの認識処理が実行される。すなわち、認識部１０２は、Ｎ個の順序情報で定められる複数のメタ情報のそれぞれから指定されたＮ個のメタ情報を用いて文字認識を実行する。

メタ情報の種類は、フィールドタイプおよび字形の他に、言語および撮影条件などのどのような種類であってもよい。複数種類のメタ情報を利用することで、より詳細な条件を仮定し、認識部１０２の予測精度をより向上させることができる。

（変形例２）
ユーザの入力するメタ情報は、重みづけされた複数のメタ情報であってもよい。例えば図２では、「住所」の重みとして「１．０」、「カタカナ名」の重みとして「０．６」のようにメタ情報に重みが付与される。

この場合、認識部１０２は、入力されたすべてのメタ情報を用いて文字認識を実行し、重みと確信度とから求められる評価値（例えば重みと確信度との積）が最良の認識結果を出力すればよい。この後、上記実施形態で述べたようなメタ情報の更新を実行することができる。

重み付き複数メタ情報指定は、メタ情報（フィールドタイプなど）がある程度限定されるが確信が持てない場合に有用である。例えば、メタ情報を推定する推定処理などにより推定されたメタ情報を、推定の確信度に相当する重みと対応づけて記憶し、記憶したメタ情報を用いて文字認識を実行するように構成することができる。このようにメタ情報を推定（予測）するシステムを用いる場合、予測結果は確率分布となることが多いため、重み付きで複数のメタ情報を指定する機能が有効である。

このように、第１の実施形態にかかる情報処理装置では、複数のメタ情報の順序を示す順序情報（グラフ構造）を用いることで、予め想定していない入力に対しても柔軟にメタ情報を更新し、より高精度な認識が可能になる。また、本実施形態によれば、メタ情報を順序情報に従って順番に表示することでユーザが適切なメタ情報を指定可能なＧＵＩを実現することができる。

（第２の実施形態）
第１の実施形態では、１つのメタ情報の接続先が１つ以下である場合を説明した。第２の実施形態では、１つのメタ情報の接続先が２つ以上の場合について説明する。

図７は、第２の実施形態にかかる情報処理装置１００−２の構成の一例を示すブロック図である。図７に示すように、情報処理装置１００−２は、表示部１１１と、記憶部１２１−２と、受付部１０１と、認識部１０２−２と、更新部１０３−２と、出力制御部１０４と、を備えている。

第２の実施形態では、記憶部１２１−２、認識部１０２−２および更新部１０３−２の機能が第１の実施形態と異なっている。その他の構成および機能は、第１の実施形態にかかる情報処理装置１００のブロック図である図１と同様であるので、同一符号を付し、ここでの説明は省略する。

記憶部１２１−２は、重みが付与された順序情報を記憶する点が、第１の実施形態の記憶部１２１と異なっている。例えば第２の実施形態では、順序情報は、複数のメタ情報をノードとし、重みが付与された有向エッジでノード間を接続した重み付き有向非巡回グラフで表される。

図８は、第２の実施形態の順序情報のデータ構造の一例を示す図である。重み付き有向非巡回グラフは、図８の「数字」のように２つ以上のノードに接続されるノードが存在するとき場合に有効である。なお第１の実施形態は、本実施形態ですべての重みを１とした特別な場合とみなすことができる。

重みの決定方法はどのような方法であってもよいが、例えば、所有するデータセット（学習データ、認識済みの帳票のデータなど）の中の各メタ情報の出現頻度から統計的に決定する方法、および、アプリケーションにおける各メタ情報の重要度から決定する方法などを適用できる。

認識部１０２−２は、重みと確信度とから評価値を算出し、評価値を用いて認識結果を評価する点が、第１の実施形態の認識部１０２と異なっている。更新部１０３−２は、確信度の代わりに評価値を用いてメタ情報を更新する点が、第１の実施形態の更新部１０３と異なっている。

次に、このように構成された第２の実施形態にかかる情報処理装置１００−２による認識処理について図９を用いて説明する。図９は、第２の実施形態における認識処理の一例を示すフローチャートである。

受付部１０１は、認識対象となる画像、および、メタ情報を受け付ける（ステップＳ２０１）。認識部１０２−２は、受け付けられた画像およびメタ情報に対して文字認識を実行し、尤もらしい文字列と、その文字列の確信度とを予測して出力する（ステップＳ２０２）。

最初の文字認識では、重みは１に設定され、指定メタ情報は１つである。２回目以降の文字認識では、メタ情報の接続先が２つ以上となりうるため、指定メタ情報は２つ以上となる場合がある。また、重みは、更新前後のメタ情報を接続する有向エッジに付与された重みが設定される。認識部１０２−２は、１以上の指定メタ情報および画像に対する文字認識の結果および確信度のペアを出力する。

認識部１０２−２は、重みおよび確信度から算出される評価値が最良のメタ情報を選択する（ステップＳ２０３）。認識部１０２−２は、例えば以下の手順に従いメタ情報を選択する。

指定メタ情報の数をＭ（Ｍは１以上の整数）とし、各メタ情報、重み、認識結果、および、確信度をそれぞれｍ_ｉ、ｗ_ｉ、ｒ_ｉ、ｓ_ｉ（ｉ＝１，２，・・・，Ｎ）と表記する。まず認識部１０２−２は、例えば以下の（１）式により、評価値を算出する。ｇは予め定められた評価値を算出する関数である。以下のｇは、確信度と重みの積を評価値とする関数の例である。
g（ｗ_ｉ、ｓ_ｉ）＝ｗ×ｓ・・・（１）

次に認識部１０２−２は、評価値が最良のメタ情報ｍ＊を以下の（２）式に従い選択する（ステップＳ２０３）。
ｍ＊＝ａｒｇｍａｘ_ｉ（ｇ（ｗ_ｉ、ｓ_ｉ））・・・（２）

認識部１０２−２は、選択したメタ情報ｍ＊に対応する評価値が閾値以上であるか否かを判定する（ステップＳ２０４）。評価値が閾値以上の場合（ステップＳ２０４：Ｙｅｓ）、認識部１０２−２は、予測した文字列を認識結果として出力し（ステップＳ２０５）、認識処理を終了する。評価値が閾値以上でない場合（ステップＳ２０４：Ｎｏ）、認識部１０２−２は、選択したメタ情報ｍ＊に対応する文字認識の結果および確信度のペアを記憶部１２１に記憶する（ステップＳ２０６）。

更新部１０３−２は、指定されたメタ情報（文字認識に用いたメタ情報）の接続先があるか否かを判定する（ステップＳ２０７）。接続先がない場合（ステップＳ２０７：Ｎｏ）、更新部１０３−２は、これまで記憶部１２１に記憶された認識結果の中から評価値が最良の認識結果を出力し（ステップＳ２０８）、認識処理を終了する。

接続先がある場合（ステップＳ２０７：Ｙｅｓ）、更新部１０３−２は、順序情報に従いメタ情報を更新する（ステップＳ２０９）。例えば更新部１０３−２は、メタ情報を、順序情報で定められた接続先のノードに相当するメタ情報に更新する。

本実施形態では、更新部１０３−２は、更新後のメタ情報に、更新前後の有向エッジに付与された重みを対応づけて、認識部１０２−２に出力する。接続先のノードが２つ以上である場合、更新部１０３−２は、複数のノードそれぞれに対応する複数のメタ情報に、それぞれ重みを対応づけて出力する。

この後、ステップＳ２０２に戻り、更新された１つ以上のメタ情報を用いて認識部１０２による文字認識が再度実行される。

このように、第２の実施形態にかかる情報処理装置では、重み付き有向非巡回グラフを使うことで、より柔軟な設計が可能になり高精度な認識を実現することができる。

（第３の実施形態）
第３の実施形態にかかる情報処理装置は、メタ情報の順序を示す順序情報を修正する機能を備える。

図１０は、第３の実施形態にかかる情報処理装置１００−３の構成の一例を示すブロック図である。図１０に示すように、情報処理装置１００−３は、表示部１１１と、記憶部１２１−３と、受付部１０１と、認識部１０２と、更新部１０３−３と、出力制御部１０４と、修正部１０５−３と、を備えている。

第３の実施形態では、記憶部１２１−３および更新部１０３−３の機能と、修正部１０５−３を追加したことが第１の実施形態と異なっている。その他の構成および機能は、第１の実施形態にかかる情報処理装置１００のブロック図である図１と同様であるので、同一符号を付し、ここでの説明は省略する。

記憶部１２１−３は、更新部１０３−３によるメタ情報の更新の履歴をさらに記憶する点が、第１の実施形態の記憶部１２１と異なっている。例えば記憶部１２１−３は、更新前後のメタ情報を対応づけた履歴を記憶する。

更新部１０３−３は、メタ情報を更新したときに、上記のような更新の履歴を記憶部１２１に記憶する機能を備える点が、第１の実施形態の更新部１０３と異なっている。

修正部１０５−３は、メタ情報の過去の更新の履歴に基づいて、順序情報が定める複数のメタ情報間の順序の少なくとも一部を修正する。例えば修正部１０５−３は、有向非巡回グラフの有向エッジを付け替えることによりメタ情報間の順序を修正する。

次に、このように構成された第３の実施形態にかかる情報処理装置１００−３によるメタ情報の修正処理について図１０を用いて説明する。図１１は、第３の実施形態における修正処理の一例を示すフローチャートである。なお、修正処理は、例えば、一定期間が経過するごと、または、一定数の文字認識を実行するごとなどの、どのようなタイミングで実行されてもよい。

修正部１０５−３は、記憶部１２１−３に記憶された更新履歴を参照して、修正対象とするメタ情報を特定する。例えば修正部１０５−３は、更新数が閾値以上のメタ情報を特定する（ステップＳ３０１）。修正部１０５−３は、順序情報内の、特定したメタ情報の接続先を修正する（ステップＳ３０２）。例えば修正部１０５−３は、特定したメタ情報の接続先を、同じ接続先に接続する他の始点ノードとなるように、順序情報の有向エッジを修正する。修正部１０５−３の修正方法は上記の方法に限られず、どのような方法であってもよい。

例えば、ユーザの扱う帳票のデザインの影響で「カタカナ名」のフィールドに誤って「カタカナ姓」が記入されることが多いとする。この場合、更新履歴として、「カタカナ名」を「カタカナ」に更新する頻度が増加する。修正部１０５−３は、このような更新履歴を参照して、「カタカナ名」の接続先のノードが、例えば「カタカナ」に接続する他の始点ノードである「カタカナ姓」となるように有向エッジを修正する。図１２は、このようにして図２の順序情報を修正した順序情報の例を示す図である。

以降の認識処理では、修正後の順序情報が使用される。これにより、誤って記入されたカタカナ姓の情報を正しく認識できる可能性を向上させることができる。

このように、第３の実施形態にかかる情報処理装置では、順序情報を修正する機能をさらに備えることにより、認識精度をより向上させることが可能となる。

（第４の実施形態）
これまでは、順序情報を用いてメタ情報を修正することにより、メタ情報を用いた文字認識処理の精度を向上させる例を説明した。順序情報を用いる処理は認識処理に限られない。第４の実施形態にかかる情報処理装置は、順序情報を用いてメタ情報を推定する推定処理の精度を向上させる例を説明する。

メタ情報の推定処理は、例えば、帳票の画像（文字列画像）から文字を認識するために各フィールドに設定するメタ情報を、文字列画像から推定する場合に用いられる。

図１３は、第４の実施形態にかかる情報処理装置１００−４の構成の一例を示すブロック図である。図１３に示すように、情報処理装置１００−４は、表示部１１１と、記憶部１２１と、受付部１０１と、認識部１０２と、推定部１０６−４と、出力制御部１０４と、を備えている。

第４の実施形態では、更新部１０３の代わりに推定部１０６−４を備える点が第１の実施形態と異なっている。その他の構成および機能は、第１の実施形態にかかる情報処理装置１００のブロック図である図１と同様であるので、同一符号を付し、ここでの説明は省略する。

推定部１０６−４は、画像に対する文字認識の結果から、画像に含まれる文字列のメタ情報を推定する。例えば推定部１０６−４は、指定されたメタ情報（例えば先端ノードに対応するメタ情報）と順序情報とに基づいてメタ情報を順に選択し、選択したメタ情報を用いた文字認識の確信度を算出する。推定部１０６−４は、算出した確信度に基づいて、画像に含まれる文字列のメタ情報を推定する。例えば推定部１０６−４は、確信度が他のメタ情報より良いメタ情報を、推定結果として出力する。

次に、このように構成された第４の実施形態にかかる情報処理装置１００−４によるメタ情報の推定処理について図１４を用いて説明する。図１４は、第４の実施形態における推定処理の一例を示すフローチャートである。

受付部１０１は、認識対象となる画像を受け付ける（ステップＳ４０１）。推定部１０６−４は、文字認識時に指定するメタ情報を選択する（ステップＳ４０２）。初回の文字認識では、推定部１０６−４は、例えば先端ノード（接続先がないノード）に対応する１以上のメタ情報を選択する。

認識部１０２は、受け付けられた画像および選択されたメタ情報に対して文字認識を実行し、尤もらしい文字列と、その文字列の確信度とを予測し、予測した確信度および文字列（認識結果）を記憶部１２１に記憶する（ステップＳ４０３）。認識部１０２は、確信度が最良のメタ情報を選択する（ステップＳ４０４）。

推定部１０６−４は、文字認識に用いたメタ情報に接続するメタ情報があるか否かを判定する（ステップＳ４０５）。例えば推定部１０６−４は、順序情報を参照し、文字認識に用いたメタ情報を接続先とする、接続元のノードに対応するメタ情報を探索する。接続元のノードがある場合、推定部１０６−４は、接続するメタ情報があると判定する。文字認識に用いたメタ情報が末端ノードである場合に、推定部１０６−４は、接続するメタ情報がないと判定する。

接続するメタ情報がない場合（ステップＳ４０５：Ｎｏ）、推定部１０６−４は、これまで記憶部１２１に記憶された認識結果の中から確信度が最良の認識結果が得られたメタ情報を、推定結果として出力し（ステップＳ４０７）、推定処理を終了する。推定部１０６−４は、推定結果であるメタ情報とともに、確信度および認識結果を出力してもよい。

接続先がある場合（ステップＳ４０５：Ｙｅｓ）、推定部１０６−４は、順序情報に従いメタ情報を更新する（ステップＳ４０６）。例えば推定部１０６−４は、メタ情報を、順序情報で定められた接続元のノードに相当するメタ情報に更新する。図２および図３に示すような順序情報の場合、メタ情報は、より小さい集合に属するメタ情報に更新される。

この後、ステップＳ４０３に戻り、更新されたメタ情報を用いて認識部１０２による文字認識が再度実行される。

以下、推定処理の具体例を説明する。図２のような順序情報が定義されており、認識対象とする画像は文字列「マイケル」を含む文字列画像であるとする。まず推定部１０６−４は、「指定なし」をメタ情報として認識部１０２に入力する。このとき確信度は「０．６」であったとする。

次に推定部１０６−４は、「指定なし」に接続する「住所」、「英数記号」、「カタカナ」をメタ情報として認識部１０２に入力する。このとき、確信度はそれぞれ「０．５」、「０．１」、「０．８」であったとする。

この場合、推定部１０６−４は、確信度が最良の「カタカナ」に接続する「カタカナ姓」、「カタカナ名」をメタ情報として認識部１０２に入力する。このとき、確信度はそれぞれ「０．６」、「０．３」であったとする。

「カタカナ姓」、「カタカナ名」に接続するノードはないため、推定部１０６−４は、確信度が「０．８」で最良であった「カタカナ」を、メタ情報の推定結果として出力する。

以上のような推定処理は、単一の文字列画像に対して実行されてもよいし、複数の文字列画像に対して実行されてもよい。例えば、同一のメタ情報を持つと想定される複数の文字列画像から、このメタ情報を推定する場合に、上記の推定処理を応用することができる。

例えば推定部１０６−４は、単一の文字列画像を入力する場合と同様の処理をすべての文字列画像について実行し、出力されたメタ情報の最頻値を推定結果として出力する。最良の推定結果の評価方法はこれに限られるものではない。例えば推定部１０６−４は、確信度を重みとした重み付き投票で評価値が最良となるメタ情報を推定結果として出力してもよい。複数の文字列画像に対する認識結果を用いて多数決を取ることによって、より精度の高いメタ情報推定を行うことができる。

（変形例３）
第１の実施形態の変形例１と同様に、メタ情報を示す順序情報は、１つのみでなく、Ｎ個以上（Ｎは２以上の整数）であってもよい。推定部１０６−４は、Ｎ個の順序情報それぞれについて、先端ノードから順にメタ情報を選択し、認識部１０２に入力する。推定部１０６−４は、Ｎ個の順序情報それぞれについて確信度が最良となるメタ情報を推定して出力する。

このように、第４の実施形態にかかる情報処理装置では、有向非巡回グラフなどの順序情報に従った順序で尤もらしいメタ情報（ノード）を優先的に探索することで、より効率的なメタ情報の推定処理を実現できる。

以上説明したとおり、第１から第４の実施形態によれば、メタ情報を用いる文字認識処理の認識精度、または、メタ情報を推定する処理の効率向上を実現できる。

次に、第１から第４の実施形態にかかる情報処理装置のハードウェア構成について図１５を用いて説明する。図１５は、第１から第４の実施形態にかかる情報処理装置のハードウェア構成例を示す説明図である。

第１から第４の実施形態にかかる情報処理装置は、ＣＰＵ（Central Processing Unit）５１などの制御装置と、ＲＯＭ（Read Only Memory）５２やＲＡＭ（Random Access Memory）５３などの記憶装置と、ネットワークに接続して通信を行う通信Ｉ／Ｆ５４と、各部を接続するバス６１を備えている。

第１から第４の実施形態にかかる情報処理装置で実行されるプログラムは、ＲＯＭ５２等に予め組み込まれて提供される。

第１から第４の実施形態にかかる情報処理装置で実行されるプログラムは、インストール可能な形式又は実行可能な形式のファイルでＣＤ−ＲＯＭ（Compact Disk Read Only Memory）、フレキシブルディスク（ＦＤ）、ＣＤ−Ｒ（Compact Disk Recordable）、ＤＶＤ（Digital Versatile Disk）等のコンピュータで読み取り可能な記録媒体に記録してコンピュータプログラムプロダクトとして提供されるように構成してもよい。

さらに、第１から第４の実施形態にかかる情報処理装置で実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。また、第１から第４の実施形態にかかる情報処理装置で実行されるプログラムをインターネット等のネットワーク経由で提供または配布するように構成してもよい。

第１から第４の実施形態にかかる情報処理装置で実行されるプログラムは、コンピュータを上述した情報処理装置の各部として機能させうる。このコンピュータは、ＣＰＵ５１がコンピュータ読取可能な記憶媒体からプログラムを主記憶装置上に読み出して実行することができる。

本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。

１００、１００−２、１００−３、１００−４情報処理装置
１０１受付部
１０２、１０２−２認識部
１０３、１０３−２，１０３−３更新部
１０４出力制御部
１０５−３修正部
１０６−４推定部
１１１表示部
１２１、１２１−２、１２１−３記憶部

Claims

認識対象とする文字に対する複数のメタ情報間の順序を定めた順序情報を記憶する記憶部と、
複数の前記メタ情報のうち指定された第１メタ情報を用いて、文字列を含む画像に対して文字認識を実行する認識部と、
前記文字認識の確信度が予め定められた条件を満たす場合に、前記順序情報に従って、前記第１メタ情報を第２メタ情報に更新する更新部と、を備え、
前記認識部は、更新された前記第２メタ情報を用いて前記文字認識を実行し、
前記順序情報は、複数の前記メタ情報をノードとし、有向エッジで前記ノード間を接続した有向非巡回グラフで表され、
前記更新部は、前記第１メタ情報を、前記第１メタ情報と前記有向エッジで接続される前記第２メタ情報に更新する、
情報処理装置。
認識対象とする文字に対する複数のメタ情報間の順序を定めた順序情報を記憶する記憶部と、
複数の前記メタ情報のうち指定された第１メタ情報を用いて、文字列を含む画像に対して文字認識を実行する認識部と、
前記文字認識の確信度が予め定められた条件を満たす場合に、前記順序情報に従って、前記第１メタ情報を第２メタ情報に更新する更新部と、を備え、
前記認識部は、更新された前記第２メタ情報を用いて前記文字認識を実行し、
前記記憶部は、Ｎ個（Ｎは２以上の整数）の順序情報を記憶し、
前記認識部は、Ｎ個の前記順序情報で定められるＮ個のメタ情報のそれぞれから指定されたＮ個の第１メタ情報を用いて前記文字認識を実行する、
情報処理装置。
認識対象とする文字に対する複数のメタ情報間の順序を定めた順序情報を記憶する記憶部と、
複数の前記メタ情報のうち指定された第１メタ情報を用いて、文字列を含む画像に対して文字認識を実行する認識部と、
前記文字認識の確信度が予め定められた条件を満たす場合に、前記順序情報に従って、前記第１メタ情報を第２メタ情報に更新する更新部と、を備え、
前記認識部は、更新された前記第２メタ情報を用いて前記文字認識を実行し、
前記順序情報は、複数の前記メタ情報をノードとし、重みが付与された有向エッジで前記ノード間を接続した有向非巡回グラフで表され、
前記更新部は、前記重みと前記確信度とから求められる評価値に基づいて、前記第１メタ情報を第２メタ情報に更新する、
情報処理装置。
前記認識部は、前記第１メタ情報と前記画像とを入力し、認識結果を出力するニューラルネットワークを用いて前記文字認識を実行する、
請求項１〜３のいずれか１項に記載の情報処理装置。
前記認識部は、重みが付与された複数の前記メタ情報のうち指定された第１メタ情報を用いて前記文字認識を実行し、
前記更新部は、前記重みと前記確信度とから求められる評価値が予め定められた条件を満たす場合に、前記順序情報に従って、前記第１メタ情報を前記第２メタ情報に更新する、
請求項１〜３のいずれか１項に記載の情報処理装置。
前記更新部による更新の履歴に基づいて、前記順序情報が定める複数のメタ情報間の順序の少なくとも一部を修正する修正部をさらに備える、
請求項１〜３のいずれか１項に記載の情報処理装置。
前記順序情報が定める順序に従い前記メタ情報を表示部に表示する出力制御部をさらに備える、
請求項１〜３のいずれか１項に記載の情報処理装置。
認識部が、認識対象とする文字に対する複数のメタ情報のうち指定された第１メタ情報を用いて、文字列を含む画像に対して文字認識を実行する認識ステップと、
更新部が、前記文字認識の確信度が予め定められた条件を満たす場合に、複数の前記メタ情報間の順序を定めた順序情報に従って、前記第１メタ情報を第２メタ情報に更新する更新ステップと、を含み、
前記認識ステップは、更新された前記第２メタ情報を用いて前記文字認識を実行し、
前記順序情報は、複数の前記メタ情報をノードとし、有向エッジで前記ノード間を接続した有向非巡回グラフで表され、
前記更新ステップは、前記第１メタ情報を、前記第１メタ情報と前記有向エッジで接続される前記第２メタ情報に更新する、
情報処理方法。
認識部が、認識対象とする文字に対する複数のメタ情報のうち指定された第１メタ情報を用いて、文字列を含む画像に対して文字認識を実行する認識ステップと、
更新部が、前記文字認識の確信度が予め定められた条件を満たす場合に、複数の前記メタ情報間の順序を定めた順序情報に従って、前記第１メタ情報を第２メタ情報に更新する更新ステップと、を含み、
前記認識ステップは、更新された前記第２メタ情報を用いて前記文字認識を実行し、
前記認識ステップは、Ｎ個（Ｎは２以上の整数）の前記順序情報で定められるＮ個のメタ情報のそれぞれから指定されたＮ個の第１メタ情報を用いて前記文字認識を実行する、
情報処理方法。
認識部が、認識対象とする文字に対する複数のメタ情報のうち指定された第１メタ情報を用いて、文字列を含む画像に対して文字認識を実行する認識ステップと、
更新部が、前記文字認識の確信度が予め定められた条件を満たす場合に、複数の前記メタ情報間の順序を定めた順序情報に従って、前記第１メタ情報を第２メタ情報に更新する更新ステップと、を含み、
前記認識ステップは、更新された前記第２メタ情報を用いて前記文字認識を実行し、
前記順序情報は、複数の前記メタ情報をノードとし、重みが付与された有向エッジで前記ノード間を接続した有向非巡回グラフで表され、
前記更新ステップは、前記重みと前記確信度とから求められる評価値に基づいて、前記第１メタ情報を第２メタ情報に更新する、
情報処理方法。
コンピュータに、
認識対象とする文字に対する複数のメタ情報のうち指定された第１メタ情報を用いて、文字列を含む画像に対して文字認識を実行する認識ステップと、
前記文字認識の確信度が予め定められた条件を満たす場合に、複数の前記メタ情報間の順序を定めた順序情報に従って、前記第１メタ情報を第２メタ情報に更新する更新ステップと、を実行させ、
前記認識ステップは、更新された前記第２メタ情報を用いて前記文字認識を実行し、
前記順序情報は、複数の前記メタ情報をノードとし、有向エッジで前記ノード間を接続した有向非巡回グラフで表され、
前記更新ステップは、前記第１メタ情報を、前記第１メタ情報と前記有向エッジで接続される前記第２メタ情報に更新する、
プログラム。
コンピュータに、
認識対象とする文字に対する複数のメタ情報のうち指定された第１メタ情報を用いて、文字列を含む画像に対して文字認識を実行する認識ステップと、
前記文字認識の確信度が予め定められた条件を満たす場合に、複数の前記メタ情報間の順序を定めた順序情報に従って、前記第１メタ情報を第２メタ情報に更新する更新ステップと、を実行させ、
前記認識ステップは、更新された前記第２メタ情報を用いて前記文字認識を実行し、
前記認識ステップは、Ｎ個（Ｎは２以上の整数）の前記順序情報で定められるＮ個のメタ情報のそれぞれから指定されたＮ個の第１メタ情報を用いて前記文字認識を実行する、
プログラム。
コンピュータに、
認識対象とする文字に対する複数のメタ情報のうち指定された第１メタ情報を用いて、文字列を含む画像に対して文字認識を実行する認識ステップと、
前記文字認識の確信度が予め定められた条件を満たす場合に、複数の前記メタ情報間の順序を定めた順序情報に従って、前記第１メタ情報を第２メタ情報に更新する更新ステップと、を実行させ、
前記認識ステップは、更新された前記第２メタ情報を用いて前記文字認識を実行し、
前記順序情報は、複数の前記メタ情報をノードとし、重みが付与された有向エッジで前記ノード間を接続した有向非巡回グラフで表され、
前記更新ステップは、前記重みと前記確信度とから求められる評価値に基づいて、前記第１メタ情報を第２メタ情報に更新する、
プログラム。
認識対象とする文字に対する複数のメタ情報間の順序を定めた順序情報を記憶する記憶部と、
複数の前記メタ情報のうち指定された第１メタ情報と、前記順序情報および前記第１メタ情報に基づいて選択された１以上の第２メタ情報と、を用いて、文字列を含む画像に対して文字認識を実行する認識部と、
前記第１メタ情報に対する前記文字認識の確信度と、前記第２メタ情報に対する前記文字認識の確信度と、に基づいて、前記画像に含まれる前記文字列のメタ情報を推定する推定部と、を備え、
前記記憶部は、Ｎ個（Ｎは２以上の整数）の順序情報を記憶し、
前記認識部は、Ｎ個の前記順序情報で定められるＮ個のメタ情報のそれぞれから指定されたＮ個の第１メタ情報を用いて前記文字認識を実行する、
情報処理装置。
前記推定部は、前記第１メタ情報に対する前記文字認識の確信度および前記第２メタ情報に対する前記文字認識の確信度のうち、他の確信度より良い確信度に対応するメタ情報を、前記画像に含まれる前記文字列のメタ情報として推定する、
請求項１４に記載の情報処理装置。
前記認識部は、前記メタ情報と前記画像とを入力し、認識結果を出力するニューラルネットワークを用いて前記文字認識を実行する、
請求項１４に記載の情報処理装置。
認識部が、認識対象とする文字に対する複数のメタ情報のうち指定された第１メタ情報と、複数の前記メタ情報の順序を定めた順序情報および前記第１メタ情報に基づいて選択された１以上の第２メタ情報と、を用いて、文字列を含む画像に対して文字認識を実行する認識ステップと、
推定部が、前記第１メタ情報に対する前記文字認識の確信度と、前記第２メタ情報に対する前記文字認識の確信度と、に基づいて、前記画像に含まれる前記文字列のメタ情報を推定する推定ステップと、を含み、
前記認識ステップは、Ｎ個（Ｎは２以上の整数）の前記順序情報で定められるＮ個のメタ情報のそれぞれから指定されたＮ個の第１メタ情報を用いて前記文字認識を実行する、
情報処理方法。
コンピュータに、
認識対象とする文字に対する複数のメタ情報のうち指定された第１メタ情報と、複数の前記メタ情報の順序を定めた順序情報および前記第１メタ情報に基づいて選択された１以上の第２メタ情報と、を用いて、文字列を含む画像に対して文字認識を実行する認識ステップと、
前記第１メタ情報に対する前記文字認識の確信度と、前記第２メタ情報に対する前記文字認識の確信度と、に基づいて、前記画像に含まれる前記文字列のメタ情報を推定する推定ステップと、を実行させ、
前記認識ステップは、Ｎ個（Ｎは２以上の整数）の前記順序情報で定められるＮ個のメタ情報のそれぞれから指定されたＮ個の第１メタ情報を用いて前記文字認識を実行する、
プログラム。