JP5417113B2

JP5417113B2 - 情報処理装置、情報処理方法、プログラムおよび記録媒体

Info

Publication number: JP5417113B2
Application number: JP2009230922A
Authority: JP
Inventors: 千絵秀石; 至幸小山; 充宏斗谷
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 2009-10-02
Filing date: 2009-10-02
Publication date: 2014-02-12
Anticipated expiration: 2029-10-02
Also published as: JP2011081454A

Description

本発明は、文章などの文字が記載された原稿を光学的に読み取って文字認識を行い、認識した文字を出力する情報処理装置、情報処理方法、プログラムおよび記録媒体に関し、特に認識結果の誤りを訂正することができる情報処理装置、情報処理方法、プログラムおよび記録媒体に関する。

光学式文字認識の分野では、文章などの文字が記載された原稿を光学的に読み取って文字認識を行い、認識した文字を出力する光学式文字読取装置などの情報処理装置は、言語処理を用いた後処理を行うことによって文字認識誤りを訂正し、認識精度を向上させるワードコレクト技術を採用している。

ワードコレクト技術としては、たとえば多くの単語を収録した単語辞書を用意しておき、認識した候補文字によって構成される文字列（以下「認識単語」という）が、その単語辞書に収録される単語と一致するか否かを判定し、一致した場合にはその単語を正しいとみなして、認識単語を単語辞書の一致した単語に置き換える技術が一般的に用いられている。

しかしながら、認識単語を単語辞書に収録されている単語で単純に置き換えるのでは、認識結果が正しくても、単語が単語辞書に収録されていなければ、認識単語が単語辞書に収録される単語と一致しないと判定され、誤コレクトつまり誤った単語に置き換えてしまう可能性がある。

誤コレクトによる認識率低下を防ぐために、認識した候補文字から単語を作成し、作成した単語に類似する単語もしくは完全に一致する単語を単語辞書から検索し、検索した単語と認識単語との類似度を計算することによって、認識単語を出力あるいは単語辞書の単語と置き換えて出力する方法が提案されている（たとえば特許文献１参照）。

また、認識される１文字ごとに、たとえば第１位〜第５位の候補文字のように複数の候補文字を抽出し、認識した文字から単語を形成する際に、複数の候補文字を組み合わせて単語を形成することによって、より高い精度で正しい単語に置き換える方法が提案されている(たとえば特許文献２参照)。しかし、この方法においても、複数の候補文字の中に正しい単語を構成することができる文字が含まれていない可能性があり、正しい置き換えを行うことができない場合がある。

複数の候補文字の中に正しい文字がない場合にも正しい単語に置き換える方法として、類似する文字を分類した類似性文字辞書を使用して正しい単語に置き換える方法が提案されている。この方法では、複数の候補文字の中に類似性文字辞書の文字に一致する文字がある場合は、その分類に属する類似文字を候補文字に追加する。そして、類似文字が追加された候補文字から単語を形成し、形成した単語と単語辞書の単語とを照合して、一致する単語を正しい文字列として出力する（たとえば特許文献３参照）。

特開平１０−１３４１５０号公報特開昭５８−４４９０号公報特開平５−１３５２１１号公報

しかしながら、特許文献３に記載される方法のように、類似性文字辞書を用いる場合、文字を認識する文字認識辞書以外に類似性文字辞書をメモリなどの記憶装置に記憶しておく必要があり、記憶装置の記憶容量が増加する。また、辞書に収録される各文字に対して、どれだけの数の類似文字を収録するかにも依存するが、あまりに少ない数では意味をなさないので、より多くの文字を収録する必要があり、辞書を記憶するために多くの記憶容量が必要になるという問題がある。

さらに、類似性文字辞書から抽出される文字の中に正しい文字が必ずしも含まれているとは限らず、それらをすべて候補文字として追加し、単語辞書に存在する単語と類似するもしくは完全に一致する単語を検索して、置き換えるのは処理が複雑になり処理時間も増加することになる。

本発明の目的は、文字認識辞書および単語辞書以外の辞書を用いることなく、認識した文字の誤りを正しい文字に訂正することができる情報処理装置、情報処理方法、プログラムおよび記録媒体を提供することである。

本発明は、文字とその文字の特徴を数値化した特徴量とを対応付けて収録する文字認識辞書、および少なくとも１つの文字からなる単語を収録する単語辞書を記憶する記憶部と、
文字列である文字列行が記載された原稿の画像から文字列を表す文字列画像を行ごとに切り出す文字列行切り出し部と、
文字列行切り出し部によって切り出された文字列画像から各文字を表す文字画像を１文字ずつ切り出す文字切り出し部と、
文字切り出し部によって切り出された文字画像から各文字画像が表す文字の特徴量を抽出する特徴抽出部と、
特徴抽出部によって抽出された特徴量と記憶部に記憶される文字認識辞書に収録された特徴量とを比較し、文字画像が表す文字ごとに、文字画像が表す文字として認識され得る候補文字を文字認識辞書から少なくとも１つ選択する選択部と、
選択部によって選択された文字画像ごとの候補文字を組み合わせて認識結果文字列を生成する文字列生成部と、
文字列生成部によって生成された認識結果文字列を構成する候補文字と、記憶部に記憶される単語辞書に収録された単語とを照合し、単語辞書に収録された単語と全文字が一致する文字列、または一部の文字のみが一致する単語を抽出し、抽出した単語からなる単語文字列を生成する単語列生成部と、
文字列生成部によって生成された認識結果文字列と単語列生成部によって生成された単語文字列とを対応する位置にある文字ごとに比較して異なる文字がある場合、異なる文字については、特徴抽出部によって抽出された特徴量と、記憶部に記憶される文字認識辞書に収録された文字の特徴量のうち単語文字列の文字に一致する文字に対応付けて記憶される特徴量とを比較し、比較結果が予め定める比較基準を満たすとき、認識結果文字列中の文字を単語文字列中の対応する文字で置き換えると判定する置き換え判定部と、
置き換え判定部によって置き換えると判定された認識結果文字列中の文字を単語文字列中の対応する位置にある文字で置き換える置き換え部とを含むことを特徴とする情報処理装置である。

また本発明は、文字とその文字の特徴を数値化した特徴量とを対応付けて収録する文字認識辞書、および少なくとも１つの文字からなる単語を収録する単語辞書を記憶する記憶部と、
文字列である文字列行が記載された原稿の画像から文字列を表す文字列画像を行ごとに切り出す文字列行切り出し部と、
文字列行切り出し部によって切り出された文字列画像から各文字を表す文字画像を１文字ずつ切り出す文字切り出し部と、
文字切り出し部によって切り出された文字画像から各文字画像が表す文字の特徴量を抽出する特徴抽出部と、
特徴抽出部によって抽出された特徴量と記憶部に記憶される文字認識辞書に収録された特徴量とを比較し、文字画像が表す文字ごとに、文字画像が表す文字として認識され得る候補文字を文字認識辞書から少なくとも１つ選択する選択部と、
選択部によって選択された文字画像ごとの候補文字を組み合わせて認識結果文字列を生成する文字列生成部と、
文字列生成部によって生成された認識結果文字列を構成する候補文字と、記憶部に記憶される単語辞書に収録された単語とを照合し、単語辞書に収録された単語と全文字が一致する文字列、または一部の文字のみが一致する単語を抽出し、抽出した単語からなる単語文字列を生成する単語列生成部と、
文字列生成部によって生成された認識結果文字列と単語列生成部によって生成された単語文字列とを対応する位置にある文字ごとに比較して異なる文字がある場合、異なる文字については、記憶部に記憶される文字認識辞書に収録された特徴量のうち認識結果文字列の文字に一致する文字に対応付けて記憶される特徴量と、記憶部に記憶される文字認識辞書に収録された特徴量のうち単語文字列の文字に一致する文字に対応付けて記憶される特徴量とを比較し、比較結果が予め定める比較基準を満たすとき、認識結果文字列中の文字を単語文字列中の対応する文字で置き換えると判定する置き換え判定部と、
置き換え判定部によって置き換えると判定された認識結果文字列中の文字を単語文字列中の対応する文字で置き換える置き換え部とを含むことを特徴とする情報処理装置である。

また本発明は、前記置き換え判定部は、前記文字列生成部によって生成された認識結果文字列と前記単語列生成部によって生成された単語文字列とを対応する位置にある文字ごとに比較して異なる文字がある場合、異なる文字については、前記特徴抽出部によって抽出された特徴量と、前記記憶部に記憶される文字認識辞書に収録された特徴量のうち単語文字列の文字に一致する文字に対応付けて記憶される特徴量とを比較して類似度を算出し、算出した類似度が予め定める閾値以上であるとき、認識結果文字列中の文字を単語文字列中の対応する文字で置き換えると判定することを特徴とする。

また本発明は、前記置き換え判定部は、前記文字列生成部によって生成された認識結果文字列と前記単語列生成部によって生成された単語文字列とを対応する位置にある文字ごとに比較して異なる文字がある場合、異なる文字については、前記記憶部に記憶される文字認識辞書に収録された特徴量のうち認識結果文字列の文字に一致する文字に対応付けて記憶される特徴量と、前記記憶部に記憶される文字認識辞書に収録された特徴量のうち単語文字列の文字の一致する文字に対応付けて記憶される特徴量とを比較して類似度を算出し、算出した類似度が予め定める閾値以上であるとき、認識結果文字列中の文字を単語文字列中の対応する文字で置き換えると判定することを特徴とする。

また本発明は、前記置き換え判定部は、前記算出した類似度が予め定める閾値未満であるとき、前記単語列生成部が前記単語文字列を生成したときに、前記単語辞書に収録された単語と全文字が一致する文字列、または一部の文字のみが一致する単語であって、前記単語文字列に含まれない単語が抽出されていた場合は、前記算出した類似度が、予め定める閾値未満の値である予め定める第２の閾値以上であるとき、認識結果文字列中の文字を単語文字列中の対応する文字で置き換えると判定することを特徴とする。

また本発明は、前記置き換え判定部は、前記算出した類似度が予め定める閾値未満であるとき、前記異なる文字を含む単語の文字数が予め定める基準文字数以上である場合は、前記算出した類似度が、予め定める閾値未満の値である予め定める第２の閾値以上であるとき、認識結果文字列中の文字を単語文字列中の対応する文字で置き換えると判定することを特徴とする。

また本発明は、文字とその文字の特徴を数値化した特徴量とを対応付けて収録する文字認識辞書、および少なくとも１つの文字からなる単語を収録する単語辞書を記憶する記憶部を含む情報処理装置で、記憶部に記憶される文字認識辞書および単語辞書を用いて文字を認識する情報処理方法であって、
文字列である文字列行が記載された原稿の画像から文字列を表す文字列画像を行ごとに切り出す文字列行切り出し工程と、
文字列行切り出し工程で切り出された文字列画像から各文字を表す文字画像を１文字ずつ切り出す文字切り出し工程と、
文字切り出し工程で切り出された文字画像から各文字画像が表す文字の特徴量を抽出する特徴抽出工程と、
特徴抽出工程で抽出された特徴量と記憶部に記憶される文字認識辞書に収録された特徴量とを比較し、文字画像が表す文字ごとに、文字画像が表す文字として認識され得る候補文字を文字認識辞書から少なくとも１つ選択する選択工程と、
選択工程で選択された文字画像ごとの候補文字を組み合わせて認識結果文字列を生成する文字列生成工程と、
文字列生成工程で生成された認識結果文字列を構成する候補文字と、記憶部に記憶される単語辞書に収録された単語とを照合し、単語辞書に収録された単語と全文字が一致する文字列、または一部の文字のみが一致する単語を抽出し、抽出した単語からなる単語文字列を生成する単語列生成工程と、
文字列生成工程で生成された認識結果文字列と単語列生成工程で生成された単語文字列とを対応する位置にある文字ごとに比較して異なる文字がある場合、異なる文字については、特徴抽出工程で抽出された特徴量と、記憶部に記憶される文字認識辞書に収録された文字の特徴量のうち単語文字列の文字に一致する文字に対応付けて記憶される特徴量とを比較し、比較結果が予め定める比較基準を満たすとき、認識結果文字列中の文字を単語文字列中の対応する文字で置き換えると判定する置き換え判定工程と、
置き換え判定工程で置き換えると判定された認識結果文字列中の文字を単語文字列中の対応する位置にある文字で置き換える置き換え工程とを含むことを特徴とする情報処理方法である。

また本発明は、文字とその文字の特徴を数値化した特徴量とを対応付けて収録する文字認識辞書、および少なくとも１つの文字からなる単語を収録する単語辞書を記憶する記憶部を含む情報処理装置で、記憶部に記憶される文字認識辞書および単語辞書を用いて文字を認識する情報処理方法であって、
文字列である文字列行が記載された原稿の画像から文字列を表す文字列画像を行ごとに切り出す文字列行切り出し工程と、
文字列行切り出し工程で切り出された文字列画像から各文字を表す文字画像を１文字ずつ切り出す文字切り出し工程と、
文字切り出し工程で切り出された文字画像から各文字画像が表す文字の特徴量を抽出する特徴抽出工程と、
特徴抽出工程で抽出された特徴量と記憶部に記憶される文字認識辞書に収録された特徴量とを比較し、文字画像が表す文字ごとに、文字画像が表す文字として認識され得る候補文字を文字認識辞書から少なくとも１つ選択する選択工程と、
選択工程で選択された文字画像ごとの候補文字を組み合わせて認識結果文字列を生成する文字列生成工程と、
文字列生成工程で生成された認識結果文字列を構成する候補文字と、記憶部に記憶される単語辞書に収録された単語とを照合し、単語辞書に収録された単語と全文字が一致する文字列、または一部の文字のみが一致する単語を抽出し、抽出した単語からなる単語文字列を生成する単語列生成工程と、
文字列生成工程で生成された認識結果文字列と単語列生成工程で生成された単語文字列とを対応する位置にある文字ごとに比較して異なる文字がある場合、異なる文字については、記憶部に記憶される文字認識辞書に収録された特徴量のうち認識結果文字列の文字に一致する文字に対応付けて記憶される特徴量と、記憶部に記憶される文字認識辞書に収録された文字の特徴量のうち単語文字列の文字に一致する文字に対応付けて記憶される特徴量とを比較し、比較結果が予め定める比較基準を満たすとき、認識結果文字列中の文字を単語文字列中の対応する文字で置き換えると判定する置き換え判定工程と、
置き換え判定工程で置き換えると判定された認識結果文字列中の文字を単語文字列中の対応する位置にある文字で置き換える置き換え工程とを含むことを特徴とする情報処理方法である。

また本発明は、文字とその文字の特徴を数値化した特徴量とを対応付けて収録する文字認識辞書、および少なくとも１つの文字からなる単語を収録する単語辞書を記憶する記憶部を含むコンピュータに、
文字列である文字列行が記載された原稿の画像から文字列を表す文字列画像を行ごとに切り出す文字列行切り出し工程と、
文字列行切り出し工程で切り出された文字列画像から各文字を表す文字画像を１文字ずつ切り出す文字切り出し工程と、
文字切り出し工程で切り出された文字画像から各文字画像が表す文字の特徴量を抽出する特徴抽出工程と、
特徴抽出工程で抽出された特徴量と記憶部に記憶される文字認識辞書に収録された特徴量とを比較し、文字画像が表す文字ごとに、文字画像が表す文字として認識され得る候補文字を文字認識辞書から少なくとも１つ選択する選択工程と、
選択工程で選択された文字画像ごとの候補文字を組み合わせて認識結果文字列を生成する文字列生成工程と、
文字列生成工程で生成された認識結果文字列を構成する候補文字と、記憶部に記憶される単語辞書に収録された単語とを照合し、単語辞書に収録された単語と全文字が一致する文字列、または一部の文字のみが一致する単語を抽出し、抽出した単語からなる単語文字列を生成する単語列生成工程と、
文字列生成工程で生成された認識結果文字列と単語列生成工程で生成された単語文字列とを対応する位置にある文字ごとに比較して異なる文字がある場合、異なる文字については、特徴抽出工程で抽出された特徴量と、記憶部に記憶される文字認識辞書に収録された文字の特徴量のうち単語文字列の文字に一致する文字に対応付けて記憶される特徴量とを比較し、比較結果が予め定める比較基準を満たすとき、認識結果文字列中の文字を単語文字列中の対応する文字で置き換えると判定する置き換え判定工程と、
置き換え判定工程で置き換えると判定された認識結果文字列中の文字を単語文字列中の対応する位置にある文字で置き換える置き換え工程とを実行させるためのプログラムである。

また本発明は、文字とその文字の特徴を数値化した特徴量とを対応付けて収録する文字認識辞書、および少なくとも１つの文字からなる単語を収録する単語辞書を記憶する記憶部を含むコンピュータに、
文字列である文字列行が記載された原稿の画像から文字列を表す文字列画像を行ごとに切り出す文字列行切り出し工程と、
文字列行切り出し工程で切り出された文字列画像から各文字を表す文字画像を１文字ずつ切り出す文字切り出し工程と、
文字切り出し工程で切り出された文字画像から各文字画像が表す文字の特徴量を抽出する特徴抽出工程と、
特徴抽出工程で抽出された特徴量と記憶部に記憶される文字認識辞書に収録された特徴量とを比較し、文字画像が表す文字ごとに、文字画像が表す文字として認識され得る候補文字を文字認識辞書から少なくとも１つ選択する選択工程と、
選択工程で選択された文字画像ごとの候補文字を組み合わせて認識結果文字列を生成する文字列生成工程と、
文字列生成工程で生成された認識結果文字列を構成する候補文字と、記憶部に記憶される単語辞書に収録された単語とを照合し、単語辞書に収録された単語と全文字が一致する文字列、または一部の文字のみが一致する単語を抽出し、抽出した単語からなる単語文字列を生成する単語列生成工程と、
文字列生成工程で生成された認識結果文字列と単語列生成工程で生成された単語文字列とを対応する位置にある文字ごとに比較して異なる文字がある場合、異なる文字については、記憶部に記憶される文字認識辞書に収録された特徴量のうち認識結果文字列の文字に一致する文字に対応付けて記憶される特徴量と、記憶部に記憶される文字認識辞書に収録された文字の特徴量のうち単語文字列の文字に一致する文字に対応付けて記憶される特徴量とを比較し、比較結果が予め定める比較基準を満たすとき、認識結果文字列中の文字を単語文字列中の対応する文字で置き換えると判定する置き換え判定工程と、
置き換え判定工程で置き換えると判定された認識結果文字列中の文字を単語文字列中の対応する位置にある文字で置き換える置き換え工程とを実行させるためのプログラムである。
また本発明は、前記プログラムを記録したコンピュータ読取り可能な記録媒体である。

本発明によれば、記憶部は、文字とその文字の特徴を数値化した特徴量とを対応付けて収録する文字認識辞書、および少なくとも１つの文字からなる単語を収録する単語辞書を記憶する。文字列行切り出し部は、文字列である文字列行が記載された原稿の画像から文字列を表す文字列画像を行ごとに切り出す。文字切り出し部は、文字列行切り出し部によって切り出された文字列画像から各文字を表す文字画像を１文字ずつ切り出す。特徴抽出部は、文字切り出し部によって切り出された文字画像から各文字画像が表す文字の特徴量を抽出する。選択部は、特徴抽出部によって抽出された特徴量と記憶部に記憶される文字認識辞書に収録された特徴量とを比較し、文字画像が表す文字ごとに、文字画像が表す文字として認識され得る候補文字を文字認識辞書から少なくとも１つ選択する。文字列生成部は、選択部によって選択された文字画像ごとの候補文字を組み合わせて認識結果文字列を生成する。単語列生成部は、文字列生成部によって生成された認識結果文字列を構成する候補文字と、記憶部に記憶される単語辞書に収録された単語とを照合し、単語辞書に収録された単語と全文字が一致する文字列、または一部の文字のみが一致する単語を抽出し、抽出した単語からなる単語文字列を生成する。置き換え判定部は、文字列生成部によって生成された認識結果文字列と単語列生成部によって生成された単語文字列とを対応する位置にある文字ごとに比較して異なる文字がある場合、異なる文字については、特徴抽出部によって抽出された特徴量と、記憶部に記憶される文字認識辞書に収録された文字の特徴量のうち単語文字列の文字に一致する文字に対応付けて記憶される特徴量とを比較し、比較結果が予め定める比較基準を満たすとき、認識結果文字列中の文字を単語文字列中の対応する文字で置き換えると判定する。そして、置き換え部は、置き換え判定部によって置き換えると判定された認識結果文字列中の文字を単語文字列中の対応する位置にある文字で置き換える。

したがって、文字認識辞書および単語辞書以外の辞書を用いることなく、認識した文字の誤りを正しい文字に訂正することができる。文字認識辞書および単語辞書以外の辞書を必要としないので、記憶容量の増加を回避することができる。

また本発明によれば、記憶部は、文字とその文字の特徴を数値化した特徴量とを対応付けて収録する文字認識辞書、および少なくとも１つの文字からなる単語を収録する単語辞書を記憶する。文字列行切り出し部は、文字列である文字列行が記載された原稿の画像から文字列を表す文字列画像を行ごとに切り出す。文字切り出し部は、文字列行切り出し部によって切り出された文字列画像から各文字を表す文字画像を１文字ずつ切り出す。特徴抽出部は、文字切り出し部によって切り出された文字画像から各文字画像が表す文字の特徴量を抽出する。選択部は、特徴抽出部によって抽出された特徴量と記憶部に記憶される文字認識辞書に収録された特徴量とを比較し、文字画像が表す文字ごとに、文字画像が表す文字として認識され得る候補文字を文字認識辞書から少なくとも１つ選択する。文字列生成部は、選択部によって選択された文字画像ごとの候補文字を組み合わせて認識結果文字列を生成する。単語列生成部は、文字列生成部によって生成された認識結果文字列を構成する候補文字と、記憶部に記憶される単語辞書に収録された単語とを照合し、単語辞書に収録された単語と全文字が一致する文字列、または一部の文字のみが一致する単語を抽出し、抽出した単語からなる単語文字列を生成する。置き換え判定部は、文字列生成部によって生成された認識結果文字列と単語列生成部によって生成された単語文字列とを対応する位置にある文字ごとに比較して異なる文字がある場合、異なる文字については、記憶部に記憶される文字認識辞書に収録された特徴量のうち認識結果文字列の文字に一致する文字に対応付けて記憶される特徴量と、記憶部に記憶される文字認識辞書に収録された文字の特徴量のうち単語文字列の文字に一致する文字に対応付けて記憶される特徴量とを比較し、比較結果が予め定める比較基準を満たすとき、認識結果文字列中の文字を単語文字列中の対応する文字で置き換えると判定する。そして、置き換え部は、置き換え判定部によって置き換えると判定された認識結果文字列中の文字を単語文字列中の対応する位置にある文字で置き換える。

また本発明によれば、前記置き換え判定部は、前記文字列生成部によって生成された認識結果文字列と前記単語列生成部によって生成された単語文字列とを対応する位置にある文字ごとに比較して異なる文字がある場合、異なる文字については、前記特徴抽出部によって抽出された特徴量と、前記記憶部に記憶される文字認識辞書に収録された特徴量のうち単語文字列の文字に一致する文字に対応付けて記憶される特徴量とを比較して類似度を算出し、算出した類似度が予め定める閾値以上であるとき、認識結果文字列中の文字を単語文字列中の対応する文字で置き換えると判定する。したがって、特徴量による類似度を指標とするので、簡単な計算で文字の類似を判定することができる。

また本発明によれば、前記置き換え判定部は、前記文字列生成部によって生成された認識結果文字列と前記単語列生成部によって生成された単語文字列とを対応する位置にある文字ごとに比較して異なる文字がある場合、異なる文字については、前記記憶部に記憶される文字認識辞書に収録された特徴量のうち認識結果文字列の文字に一致する文字に対応付けて記憶される特徴量と、前記記憶部に記憶される文字認識辞書に収録された特徴量のうち単語文字列の文字の一致する文字に対応付けて記憶される特徴量とを比較して類似度を算出し、算出した類似度が予め定める閾値以上であるとき、認識結果文字列中の文字を単語文字列中の対応する文字で置き換えると判定する。したがって、特徴量による類似度を指標とするので、簡単な計算で文字の類似を判定することができる。

また本発明によれば、前記置き換え判定部は、前記算出した類似度が予め定める閾値未満であるとき、前記単語列生成部が前記単語文字列を生成したときに、前記単語辞書に収録された単語と全文字が一致する文字列、または一部の文字のみが一致する単語であって、前記単語文字列に含まれない単語が抽出されていた場合は、前記算出した類似度が、予め定める閾値未満の値である予め定める第２の閾値以上であるとき、認識結果文字列中の文字を単語文字列中の対応する文字で置き換えると判定する。

したがって、単語の候補が１つしか生成されていない場合は、その単語の候補は、正解である可能性が高く、類似度が予め定める閾値未満であっても、最適な単語として置き換えることができる。たとえば、光学式文字認識では、「かすれ」あるいは「にじみ」が原因で、複数の文字からなる単語のうちの１つの文字が正しく認識されない場合、類似度が低くなり、予め定める閾値未満になることがあるが、単語辞書から抽出された単語が１つである場合、正解である可能性は非常に高く、この単語を用いて修正することによって、正しい文字に訂正することができるという効果がある。

また本発明によれば、前記置き換え判定部は、前記算出した類似度が予め定める閾値未満であるとき、前記異なる文字を含む単語の文字数が予め定める基準文字数以上である場合は、前記算出した類似度が、予め定める閾値未満の値である予め定める第２の閾値以上であるとき、認識結果文字列中の文字を単語文字列中の対応する文字で置き換えると判定する。したがって、文字数が多い単語については、類似度が予め定める閾値未満であっても、正解である可能性が高く、最適な単語を選択して置き換えることができる。

また本発明によれば、文字とその文字の特徴を数値化した特徴量とを対応付けて収録する文字認識辞書、および少なくとも１つの文字からなる単語を収録する単語辞書を記憶する記憶部を含む情報処理装置で、記憶部に記憶される文字認識辞書および単語辞書を用いて文字を認識するにあたって、文字列行切り出し工程では、文字列である文字列行が記載された原稿の画像から文字列を表す文字列画像を行ごとに切り出す。文字切り出し工程では、文字列行切り出し工程で切り出された文字列画像から各文字を表す文字画像を１文字ずつ切り出す。特徴抽出工程では、文字切り出し工程で切り出された文字画像から各文字画像が表す文字の特徴量を抽出する。選択工程では、特徴抽出工程で抽出された特徴量と記憶部に記憶される文字認識辞書に収録された特徴量とを比較し、文字画像が表す文字ごとに、文字画像が表す文字として認識され得る候補文字を文字認識辞書から少なくとも１つ選択する。文字列生成工程では、選択工程で選択された文字画像ごとの候補文字を組み合わせて認識結果文字列を生成する。単語列生成工程では、文字列生成工程で生成された認識結果文字列を構成する候補文字と、記憶部に記憶される単語辞書に収録された単語とを照合し、単語辞書に収録された単語と全文字が一致する文字列、または一部の文字のみが一致する単語を抽出し、抽出した単語からなる単語文字列を生成する。置き換え判定工程では、文字列生成工程で生成された認識結果文字列と単語列生成工程で生成された単語文字列とを対応する位置にある文字ごとに比較して異なる文字がある場合、異なる文字については、特徴抽出工程で抽出された特徴量と、記憶部に記憶される文字認識辞書に収録された文字の特徴量のうち単語文字列の文字に一致する文字に対応付けて記憶される特徴量とを比較し、比較結果が予め定める比較基準を満たすとき、認識結果文字列中の文字を単語文字列中の対応する文字で置き換えると判定する。そして、置き換え工程では、置き換え判定工程で置き換えると判定された認識結果文字列中の文字を単語文字列中の対応する位置にある文字で置き換える。

したがって、文字認識辞書および単語辞書以外の辞書を用いることなく、認識した文字の誤りを正しい文字に訂正することができる。文字認識辞書および単語辞書以外の辞書を必要としないので、情報処理装置の記憶容量の増加を回避することができる。

また本発明によれば、文字とその文字の特徴を数値化した特徴量とを対応付けて収録する文字認識辞書、および少なくとも１つの文字からなる単語を収録する単語辞書を記憶する記憶部を含む情報処理装置で、記憶部に記憶される文字認識辞書および単語辞書を用いて文字を認識するにあたって、文字列行切り出し工程では、文字列である文字列行が記載された原稿の画像から文字列を表す文字列画像を行ごとに切り出す。文字切り出し工程では、文字列行切り出し工程で切り出された文字列画像から各文字を表す文字画像を１文字ずつ切り出す。特徴抽出工程では、文字切り出し工程で切り出された文字画像から各文字画像が表す文字の特徴量を抽出する。選択工程では、特徴抽出工程で抽出された特徴量と記憶部に記憶される文字認識辞書に収録された特徴量とを比較し、文字画像が表す文字ごとに、文字画像が表す文字として認識され得る候補文字を文字認識辞書から少なくとも１つ選択する。文字列生成工程では、選択工程で選択された文字画像ごとの候補文字を組み合わせて認識結果文字列を生成する。単語列生成工程では、文字列生成工程で生成された認識結果文字列を構成する候補文字と、記憶部に記憶される単語辞書に収録された単語とを照合し、単語辞書に収録された単語と全文字が一致する文字列、または一部の文字のみが一致する単語を抽出し、抽出した単語からなる単語文字列を生成する。置き換え判定工程では、文字列生成工程で生成された認識結果文字列と単語列生成工程で生成された単語文字列とを対応する位置にある文字ごとに比較して異なる文字がある場合、異なる文字については、記憶部に記憶される文字認識辞書に収録された特徴量のうち認識結果文字列の文字に一致する文字に対応付けて記憶される特徴量と、記憶部に記憶される文字認識辞書に収録された文字の特徴量のうち単語文字列の文字に一致する文字に対応付けて記憶される特徴量とを比較し、比較結果が予め定める比較基準を満たすとき、認識結果文字列中の文字を単語文字列中の対応する文字で置き換えると判定する。そして、置き換え工程では、置き換え判定工程で置き換えると判定された認識結果文字列中の文字を単語文字列中の対応する位置にある文字で置き換える。

また本発明によれば、コンピュータに情報処理方法の各工程を実行させるためのプログラムとして提供することができる。

また本発明によれば、コンピュータに前記情報処理方法の各工程を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体として提供することができる。

本発明の一実施形態である情報処理装置１の構成を示すブロック図である。入力装置２から受信した画像データが表す画像４０の一例を示す図である。文字列行切り出し部１５によって切り出された文字列行画像４１の一例を示す図である。文字切り出し部１６によって切り出された文字画像４２の一例を示す図である。特徴抽出部１７によって抽出された特徴量を説明するための図である。候補文字４３および認識結果文字列４４の一例を示す図である。単語列生成部２１によって生成された単語文字列４５の一例を示す図である。認識結果文字列と単語文字列との比較例４６を示す図である。単語文字列の文字の特徴量および対応する位置にある候補文字の特徴量の一例を示す図である。情報処理装置１、入力装置２および出力装置３が実行する文字認識処理の処理手順を示すフローチャートである。後処理部２０が実行する第１の後処理の処理手順を示すフローチャートである。文字切り出し部１６によって切り出された文字画像５２の一例を示す図である。候補文字５３および認識結果文字列５４の一例を示す図である。単語列生成部２１によって生成された単語文字列５５の一例を示す図である。認識結果文字列と単語文字列との比較例５６を示す図である。単語文字列の文字の特徴量および対応する位置にある候補文字の特徴量の一例を示す図である。後処理部２０ａが実行する第２の後処理の処理手順を示すフローチャートである。入力装置２から受信した画像データが表す画像６０の一例を示す図である。文字列行切り出し部１５によって切り出された文字列行画像６１の一例を示す図である。文字切り出し部１６によって切り出された文字画像６２の一例を示す図である。

候補文字６３および認識結果文字列６４の一例を示す図である。単語列生成部２１によって生成された単語文字列６５の一例を示す図である。認識結果文字列と単語文字列との比較例６６を示す図である。単語文字列の文字の特徴量および対応する位置にある候補文字の特徴量の一例を示す図である。後処理部２０ｂが実行する第３の後処理の処理手順を示すフローチャートである。

図１は、本発明の第１の実施形態である情報処理装置１の構成を示すブロック図である。本発明に係る情報処理方法は、情報処理装置１によって実行される。情報処理装置１は、入力装置２および出力装置３に接続され、文章などが記載された原稿を入力装置２によって画像として読み取り、読み取った画像を表す画像データに基づいて文字認識を行い、認識した文字からなる文字列の誤りを正しい文字列に訂正して、出力装置３に出力する装置である。

入力装置２は、たとえば原稿を画像として読み取るスキャナなどの画像読み取り装置であり、読み取った画像を表す画像データを情報処理装置１に送信する。出力装置３は、たとえば液晶ディスプレイによって構成されるモニタなどの表示装置であり、情報処理装置１から受信する情報を画面に表示する。図１に示した実施形態では、入力装置２および出力装置３は、情報処理装置１とは独立した装置として構成したが、情報処理装置１に含めてもよい。

情報処理装置１は、たとえばパーソナルコンピュータなどのコンピュータによって構成され、制御部１１、入出力制御部１２、メモリ１３、文字認識辞書１４、文字列行切り出し部１５、文字切り出し部１６、特徴抽出部１７、マッチング部１８、文字列生成部１９および後処理部２０を含んで構成される。後処理部２０は、単語列生成部２１、置き換え判定部２２、置き換え部２３および単語辞書２４を含んで構成される。

制御部１１は、たとえば図示しない中央処理装置（Central Processing Unit；略称ＣＰＵ）によって構成される。入出力制御部１２は、制御部１１と入力装置２との間の情報の送受信、および制御部１１と出力装置３との間の情報の送受信を制御する。記憶部であるメモリ１３は、たとえば半導体メモリ装置あるいはハードディスク装置などの記憶装置によって構成され、制御部１１によって実行されるプログラム、およびプログラムを実行するために必要な情報を記憶する。メモリ１３に記憶される情報は、制御部１１によって読み書きされる。制御部１１は、メモリ１３に記憶されるプログラムを実行することによって、入出力制御部１２を制御するとともに、文字列行切り出し部１５、文字切り出し部１６、特徴抽出部１７、マッチング部１８、文字列生成部１９および後処理部２０などの機能を実現する。本実施形態では、メモリ１３を情報処理装置１に含めているが、情報処理装置１に接続される独立した記憶装置によって構成してもよいし、あるいは着脱可能な記録媒体によって構成してもよい。

文字認識辞書１４は、文字コードで表わされる文字と文字の特徴を数値化した特徴量とを対応付けて収録した辞書である。単語辞書２４は、少なくとも１つの文字からなる単語を収録する辞書である。単語辞書２４にも文字ごとの文字コードが記憶されている。文字認識辞書１４および単語辞書２４は、メモリ１３に記憶される。

制御部１１は、入出力制御部１２によって、入力装置２から送信される画像データを受信し、受信した画像データを文字列行切り出し部１５に送る。文字列行切り出し部１５は、制御部１１から受け取った画像データが表す画像から文字列を表す文字列行画像を行ごとに切り出す。文字切り出し部１６は、文字列行切り出し部１５によって切り出された文字列行画像から、文字を１文字ずつ表す矩形画像である文字画像を切り出す。特徴抽出部１７は、文字切り出し部１６によって切り出された文字画像が表す文字の特徴を数値化した特徴量を抽出する。

選択部であるマッチング部１８は、文字認識辞書１４とのマッチング処理を行う。マッチング処理は、文字画像の特徴と文字認識辞書１４に収録されている文字の特徴とを比較し、どれだけ似ているかを数値化する処理である。具体的には、マッチング部１８は、特徴抽出部１７によって抽出された特徴量と、文字認識辞書１４に収録されているすべての文字の特徴量とを比較して、文字画像が表す文字と文字認識辞書１４に収録された文字との類似度を算出する。そして、算出した類似度に基づいて、文字画像が表す文字の候補文字を少なくとも１つ、たとえば第１候補〜第５候補の候補文字を抽出する。文字列生成部１９は、マッチング部１８によって抽出された候補文字に示される候補文字のうち、第１候補の候補文字を左から順に並べた認識結果文字列を生成する。

後処理部２０は、第１の後処理を行う。第１の後処理では、単語列生成部２１は、文字列生成部１９によって生成された認識結果文字列を構成する各文字の複数の候補文字を組み合わせて、単語辞書２４と照合し、最適な単語を選択することで構成される単語文字列を生成する。置き換え判定部２２は、単語列生成部２１によって生成された単語文字列と、文字列生成部１９によって生成された認識結果文字列とを比較し、比較結果が予め定める比較基準を満たすとき、文字を置き換えると判定する。置き換え部２３は、置き換え判定部２２によって置き換えると判定された文字について、認識結果文字列中の文字を単語文字列中の文字で置き換え、置き換えた認識結果文字列を出力装置３に出力する。以下、文字列行切り出し部１５、文字切り出し部１６、特徴抽出部１７、マッチング部１８、文字列生成部１９および後処理部２０を詳細に説明する。

図２は、入力装置２から受信した画像データが表す画像４０の一例を示す図である。入力装置２から受信した画像データが表す画像４０は、文字列行が記載された原稿を入力装置２によって読み取った画像である。文字列行は、少なくとも１つの行からなる文字列である。文字列は、横書きでもよいし、縦書きでもよい。横書きのときは、横方向が文字列であり、縦方向が行である。縦書きのときは、縦方向が文字列で、横方向が行である。画像は、カラー画像でもよいが、本実施形態では、画像は白黒画像であるとして、以下説明する。白画素からなる部分は背景部分であり、黒画素からなる部分が文字部分である。

図２に示した画像４０の例には、２行にわたる文字列行が示されており、第１行目には、「入居者の保険医療制度についてアンケートを実施。」と示され、第２行目には、「協力、理解を得るために事前に説明会を行った。」と示されている。

図３は、文字列行切り出し部１５によって切り出された文字列行画像４１の一例を示す図である。文字列行切り出し部１５は、制御部１１が入出力制御部１２によって入力装置２から受信した画像データを制御部１１から受け取り。受け取った画像データが表す画像から文字列を表す文字列行画像を行ごとに切り出す。

文字列行画像を切り出す方法は、周知の方法でよく、本実施形態では、たとえば、文字列行切り出し部１５は、画像内の空白部分つまり白画素部分、および文字部分つまり黒画素部分の分布から、文字列行画像を切り出す。具体的には、行と行との間には一定の連続する白画素の分布があることを利用して、文字列行画像を切り出す。文字列行画像を切り出す方法は、この方法に限定されるものではなく、これ以外のどのような方法を用いてもよい。

図３に示した文字列行画像４１の例には、文字列行画像４１１，４１２の２つの文字列行画像が示されている。文字列行画像４１１は、「入居者の保険医療制度について、」という文字列が表示された画像であり、文字列行画像４１２は、「協力、理解を得るために事前に説明会を行った。」という文字列が表示された画像である。

図４は、文字切り出し部１６によって切り出された文字画像４２の一例を示す図である。文字切り出し部１６は、文字列行切り出し部１５によって切り出された文字列行画像から、文字を１文字ずつ矩形画像である文字画像として切り出す。

文字切り出し手法も周知の方法でよいが、文字の上下左右方向の各々一番突出する部分の座標を最大値として外接矩形で切り出すことを条件とする。本実施形態では、座標は、たとえば図２に示した画像４０の左上の頂点を原点とし、画像４０に向かって左右方向をＸ軸、上下方向をＹ軸とする座標系における座標である。文字画像は、Ｘ軸に平行な２辺とＹ軸に平行な２辺とからなる４辺で囲まれる矩形の画像であり、１つの文字を含む最小の大きさの矩形画像である。

図４に示した文字画像４２の例には、１５文字の文字画像が示されている。最初の文字画像４２１は、「入」という文字を切り出した文字画像であり、第２番目以降に「居」、「者」、「の」、「保」、「険」、「医」、「療」、「制」、「度」、「に」、「つ」、「い」、「て」および「、」の各文字の文字画像が示されている。

図５は、特徴抽出部１７によって抽出された特徴量を説明するための図である。特徴抽出部１７は、文字切り出し部１６によって切り出された文字画像が表す文字の特徴を数値化した特徴量を抽出する。特徴抽出部１７は、後処理部２０のために、抽出した特徴量を文字画像ごとにメモリ１３に記憶しておく。

特徴抽出の手法としては、「メッシュ特徴」と呼ばれる手法がよく知られており、本実施形態でも、特徴抽出部１７は、「メッシュ特徴」と呼ばれる手法を用いて特徴量を抽出する。「メッシュ特徴」とは、切り出された矩形画像である文字画像を、メッシュに分割し、各メッシュにおける黒画素数を数値化して正規化を行う処理である。

図５（ａ）は「あ」という文字の文字画像３０を縦横８×８＝６４のメッシュ３１に分割して区切った図である。図５（ｂ）は、図５（ａ）に示した各メッシュ３１における黒画素数を数値化して正規化した特徴データ３２の一例を示す図である。特徴データ３２は、それぞれのメッシュ３１の文字部分の特徴量を、対応する位置にある８×８のメッシュ３３ごとに表したデータである。対応する位置とは、８×８のメッシュの中で同じ位置にあるということである。

たとえば最上段の各メッシュ３３は、左から順に、第１番目のメッシュ３１の特徴量が「０」であることを示し、第２番目のメッシュ３１の特徴量が「０」であることを示し、第３番目のメッシュ３１の特徴量が「１５」であることを示し、第４番目のメッシュ３１の特徴量が「３４」であることを示し、第５番目のメッシュ３１の特徴量が「０」であることを示し、第６番目のメッシュ３１の特徴量が「０」であることを示し、第７番目のメッシュ３１の特徴量が「３」であり、第８番目のメッシュ３１の特徴量が「０」であることを示している。

図６は、候補文字４３および認識結果文字列４４の一例を示す図である。図６（ａ）は、マッチング部１８によって抽出された候補文字４３の一例を示す。候補文字４３は、文字画像４２が表す文字として、マッチング部１８によって抽出された候補の文字である。マッチング部１８は、特徴抽出部１７によって抽出された特徴量と、文字認識辞書１４に収録されているすべての文字の特徴量とを比較して、文字画像が表す文字と文字認識辞書１４に収録された文字との類似度を算出し、算出した類似度に基づいて、文字画像が表す文字の候補文字を少なくとも１つ抽出する。本実施形態では、類似度の高い文字から最大で５つの候補文字、第１候補〜第５候補の候補文字を抽出する。

類似度は、文字画像が表す文字と文字認識辞書１４に収録された文字とが、どれだけ似ているかを評価するための指標であり、類似度が高いほどより似ていることを示す。本実施形態では、類似度として、単純類似度と呼ばれる指標を用いてどれだけ似ているかを評価する。単純類似度Ｓは、式（１）で算出する。

ここに、文字画像が示す文字の特徴データをＸ、文字認識辞書１４に収録されている文字の特徴データをＹ、文字画像の第ｍ番目のメッシュの特徴量をｘ_ｍ、文字認識辞書１４に収録されている文字の第ｍ番目のメッシュの特徴量をｙ_ｍ、メッシュの数をｋとしている。メッシュの第ｍ番目とは、本実施形態では、８×８のメッシュであるので、ｋ＝６４であり、最上段の左から順にｍ＝１，２，３，……８であり、右端までくると、次段の左端からｍ＝９，１０，１１，……であり、最下段の右端がｍ＝６４である。

式（１）の最右辺の分母は、文字画像が表す文字の特徴データおよび文字認識辞書１４に収録されている文字の特徴データを正規化しておくと一定となるので、式（１）で計算を行うのは、分子についてのみ計算を行えばよい。本実施形態では、８×８のメッシュについてメッシュ特徴を用いているので、分子は、式（２）のように表すことができる。

式（２）を用いると、計算結果の値が非常に大きくなって扱いにくいので、本実施形態では、式（３）に示すように式（２）の計算結果を「５１２」で除算した値を、単純類似度Ｓとして用いる。

式（３）によって、単純類似度Ｓの最大値は「１２８」になるように設定される。
特徴抽出部１７は、文字切り出し部１６によって切り出された文字画像ごとに、文字認識辞書１４に収録されている文字との類似度を式（３）によって計算する。そして、文字認識辞書１４に収録されている文字から、類似度が高い順に第１候補〜第５候補の５つまでの候補文字を抽出する。候補文字は、文字画像が表す文字としての候補となる文字である。類似度が、予め定める最低基準未満であるときは、候補文字として抽出しない。予め定める最低基準は、たとえば「８０」である。本実施形態では、予め定める最低基準を「８０」としたが、この値に限定されるものではない。また、予め定める最低基準による判断を行うことなく、常に第１候補〜第５候補までを抽出するようにしてもよい。本実施形態では、候補文字を第５候補までとしたが、これに限定されるものではなく、たとえば第１０候補まで抽出してもよい。ただし、文字列が長くなった場合、あるいは認識する文字列が増加した場合は、記憶するデータ量も増加することに注意する必要がある。

図６（ａ）に示した候補文字４３は、最上段に入力文字を左から順に配置し、第２段目に最上段のそれぞれの文字に対する第１候補の候補文字、第３段目に最上段のそれぞれの文字に対する第２候補の候補文字、第４段目に最上段のそれぞれの文字に対する第３候補の候補文字、第５段目に最上段のそれぞれの文字に対する第４候補の候補文字、第６段目に最上段のそれぞれの文字に対する第５候補の候補文字を示している。入力文字は、候補文字の本来の文字、つまり原稿に記載されていた文字であり、以下「正解文字」ともいう。各候補文字の下側に付している数字は、その候補文字の類似度を表している。第１候補は、類似度が最も高い候補文字であり、以降類似度が高い順に、第２候補、第３候補、第４候補および第５候補の候補文字となる。

図６（ａ）に示した候補文字４３の例では、最上段に、入力文字として、「入」、「居」、「者」、「の」、「保」、「険」、「医」、「療」、「制」、「度」、「に」、「つ」、「い」、「て」および「、」が示されている。第１候補〜第５候補については、たとえば正解文字「入」については、第１候補「入１２１」、第２候補「人１２０」、第３候補「大１１５」および第４候補「λ １１０」が示され、第５候補は、空白である。

図６（ｂ）は、文字列生成部１９によって生成された認識結果文字列４４の一例を示す。文字列生成部１９は、マッチング部１８によって抽出された候補文字４３に示される候補文字のうち、第１候補の候補文字を左から順に並べた認識結果文字列４４を生成する。文字列生成部１９は、後処理部２０のために、候補文字４３をメモリ１３に記憶しておく。図６（ｂ）に示した例では、認識結果文字列４４として「入居青の振険医療制度について、」なる文字列が示されている。後処理部２０による処理を行わない場合は、この認識結果文字列４４を、認識結果として出力することになる。本実施形態では、この後、後処理部２０によって第１の後処理が実行される。

後処理部２０は、第１の後処理を実行する。すなわち、文字列生成部１９によって生成された認識結果文字列４４を構成する各文字の複数の候補文字を組み合わせて、単語辞書２４と照合し、最適な単語を選択することで構成される単語文字列を生成する。そして、生成した単語文字列と、文字列生成部１９によって生成された認識結果文字列４４とを比較して、認識結果文字列４４中の誤りを修正し、修正した認識結果文字列を出力装置３に出力する。第１の後処理は、後処理部２０に含まれる単語列生成部２１、置き換え判定部２２および置き換え部２３によって実行される。

具体的には、単語列生成部２１は、文字列生成部１９によって生成された認識結果文字列４４を構成する各文字の複数の候補文字を組み合わせて複数生成される文字列と、単語辞書２４に収録されている単語とを照合して単語の候補を生成し、生成した単語の候補の中から最適な単語を選択することによって構成される単語文字列を生成する。

候補文字から単語の候補を生成する方法には、形態素解析を用いる方法などがあるが、どのような方法を用いてもよい。本実施形態では、認識結果文字列４４の第１文字目から順に、各候補文字について、単語辞書２４に収録されている単語に完全に一致する文字列、もしくは部分的に一致する文字列を単語の候補として生成する。

たとえば、図６（ｂ）に示した認識結果文字列４４のうち、第１文字目〜第３文字目の文字列は、「入居青」である。ここで、単語辞書２４に「入居者」という単語が存在していれば、この「入居者」が「入居青」に対応する単語の候補として抽出される。また、「入居」という単語が単語辞書２４に収録されていれば「入居」も単語の候補になる。

「入居」および「入居者」が単語の候補として単語辞書２４から抽出された場合は、もし、認識結果文字列４４の第３文字目の「青」という第１候補の候補文字に対応する第２候補〜第５候補の候補文字の中に「者」の文字があれば、「入居者」という単語を構成する文字を、認識結果文字列４４を構成する文字の候補文字で生成することができる。第１候補の候補文字に対応する第２候補〜第５候補の候補文字とは、入力文字が第１候補の候補文字と同じ第２候補〜第５候補の候補文字ということである。そして、「入居者」という単語の候補は「入居」という単語の候補よりも単語長が長いので、単語長が長いほうの「入居者」を最適な単語として選択する。

また、もし文字「青」の候補文字に対応する第２候補〜第５候補の候補文字の中に「者」という文字が存在しない場合、つまり図６（ａ）のような場合は、認識結果文字列４４を構成する文字と一致する文字の文字数が同じであれば、単語を構成する文字の文字数が大きいほうの単語を選択する。つまり、「入居」という単語の候補および「入居者」という単語の候補は、どちらも「入居」という文字列が、認識結果文字列４４の第１，２文字目の文字列と一致している。そして「入居」という単語の候補は単語を構成する文字数が２であり、「入居者」という単語の候補は単語を構成する文字数が３であることから、「入居者」を選択することになる。これは、部分的に一致する文字列を最適な単語として選択する例である。以下部分的に一致することを「部分一致」ともいう。

単語列生成部２１は、認識結果文字列４４の第４文字目についても、単語辞書２４に収録されている単語と完全に一致する文字列、もしくは部分的に一致する文字列を最適な単語として選択する。単語列生成部２１は、この処理を、認識結果文字列４４の最終文字、たとえば図６（ｂ）に示した例では「、」の文字に対する最適な単語を選択するまで繰り返す。

ただし、この処理においては、すべての認識結果文字列４４を構成する候補文字以外の候補文字の組合せを用いて単語辞書２４と照合し、単語辞書２４に収録された単語との部分一致も許容する構成としているので、以下のようなことを考慮する必要がある。

たとえば、図６（ｂ）に示した認識結果文字列４４を構成する第５，６文字目は、正しくは「保険」という文字列であるが、マッチング結果では認識結果文字列４４の第５，６文字目は「振険」となっており、単語辞書２４を検索した場合、部分一致となる「保険」および「振替」などの単語が単語の候補として生成される。すなわち、図６（ａ）に示した候補文字４３には、「保」および「替」の文字がそれぞれ「保」の候補文字および「険」の候補文字に存在しないため、完全に一致する単語の候補がなく、部分一致となる複数の単語の候補が生成される。たとえば「険」の第３候補である「陰」と部分一致である「山陰」、および「険」の第２候補である「陵」と部分一致である「丘陵」などの部分一致となる単語が単語辞書２４に収録されていれば、単語の候補として生成される。このようにして生成された単語の候補の一例を図７に示す。

図７は、単語列生成部２１によって生成された単語文字列４５の一例を示す図である。図７に示した単語文字列４５の例には、最適な単語たとえば単語４５１、および複数生成された単語の候補たとえば単語の候補４５２が混在している。単語の候補４５２には、４つの単語「保険」、「振替」、「山陰」および「丘陵」が生成されている。複数の候補がある場合は、単語列生成部２１は、以下のような３つの条件で優先順位をつけて、最適な単語を選択し、最適な単語のみからなる単語文字列を生成する。以下、単語の候補が２文字からなる場合を例にして説明する。

条件１は、第１番目の文字が候補文字内に存在する文字であり、かつ第２番目の文字が候補文字内に存在する文字であるという条件である。条件２は、第１番目の文字が候補文字内に存在する文字であり、かつ第２番目の文字が候補文字内に存在しない文字であるという条件、または第１番目の文字が候補文字内に存在しない文字であり、かつ第２番目の文字が候補文字内に存在する文字であるという条件である。条件３は、２文字の類似度が最大であるという条件である。２文字の類似度とは、単語の候補と、認識結果文字列の文字のうちその単語の候補に対応する位置にある２文字との類似度である。対応する位置とは、認識結果文字列および単語文字列のそれぞれの先頭文字からの順番が同じ位置ということである。２文字の類似度は、２文字を構成する各文字の類似度の平均値である。本実施形態では、２文字の類似度の平均値を用いているが、２文字の類似度の合計値を用いてもよい。

単語列生成部２１は、複数の単語の候補の中に、条件１を満たす単語の候補が１つであれば、その単語の候補を最適な単語として選択する。条件１を満たす単語の候補がなく、かつ条件２を満たす単語の候補が１つであれば、その単語の候補を最適な単語として選択する。条件１を満たす単語の候補が複数あるときまたは条件２を満たす単語の候補が複数あるとき、条件３を満たす単語の候補を最適な単語として選択する。

たとえば図７に示した第５，６文字目の単語の候補４５２の場合、単語の候補として、「保険」、「振替」、「山陰」および「丘陵」が生成されている。これらの単語の候補は、いずれも条件１を満たさず、条件２を満たすので、条件３によって最適な単語を選択する。それぞれの類似度は、「保険」が「１１８」であり、「振替」が「１１７」であり、「山陰」が「１１４」であり、「丘陵」が「１１６」である。したがって、単語列生成部２１は、これら４つの単語の候補の中から最大の類似度「１１８」である「保険」を最適な単語として選択する。

本実施形態では、最適な単語を上述した条件に従って選択したが、このような条件だけに限らず、候補文字のうち第１候補および第２候補の候補文字を優先として、第３候補以降の候補を使用せずに構成することができる単語のみを選択するような構成にしてもよい。

図８は、認識結果文字列と単語文字列との比較例４６を示す図である。比較例４６は、上段が文字列生成部１９によって生成された認識結果文字列であり、下段が単語列生成部２１によって生成された単語文字列である。図８に示した下段の単語文字列は、図７に示した単語文字列４５で最適な単語として選択された単語からなる文字列である。比較例４６は、単語文字列の各々の単語を構成する文字数で区切った矩形によって、認識結果文字列と単語文字列とを区切って示している。

置き換え判定部２２は、文字列生成部１９で生成された認識結果文字列と単語列生成部２１によって生成された単語文字列とを、単語ごとに先頭文字から一文字ずつ比較して、異なるか否かを判定する。文字が異なるか否かは、たとえば認識結果文字列中の文字の文字コードと、単語文字列中の文字の文字コードとが異なるか否かによって判定することができる。文字コードが異なるときに、文字が異なると判定し、文字コードが一致するときに、文字が異ならないと判定する。文字コードは、たとえば文字認識辞書１４および単語辞書２４のそれぞれに、文字ごとに収録しておくことによって実現可能である。本実施形態では、先頭文字から一文字ずつ比較するが、単語の最後尾の文字から先頭文字の方向に順番に一文字ずつ比較してもよい。

置き換え判定部２２は、単語を構成するすべての文字について、異なる文字がない場合、つまり同じ文字である場合、単語を構成するすべての文字について、置き換えると判定する。

置き換え判定部２２は、異なる文字がある場合、さらに、単語を構成する文字の中で異なると判定された文字と同じ文字が、認識結果文字列を構成する候補文字以外の対応する位置にある候補文字の中にあるか否かを判定する。対応する位置にあるとは、単語文字列中の文字の先頭からの位置と、認識結果文字列の先頭からの位置とが同じである位置にあるということである。単語を構成する文字の中で異なると判定された文字と同じ文字が、認識結果文字列を構成する候補文字以外の対応する位置にある候補文字の中にすべてある場合、置き換え判定部２２は、単語を構成するすべての文字について、置き換えると判定する。

すなわち、単語を構成する文字と同じ文字が、認識結果文字列の対応する位置にある候補文字の中にすべてある場合、置き換え判定部２２は、単語を構成するすべての文字について、置き換えると判定する。

本実施形態では、置き換え判定部２２は、このように候補文字の中に一致する候補文字があるか否かを検索したが、単語列生成部２１が単語文字列を生成するとき、各単語が部分一致の単語であり、かつ単語を構成する文字が候補文字に存在しない文字であるか否かを示す情報をメモリ１３に記憶しておき、置き換え判定部２２は、メモリ１３に記憶されるその情報を参照することによって、候補文字にあるか否かを判定してもよい。

置き換え判定部２２は、単語を構成する文字のうちいずれかの文字と同じ文字が、認識結果文字列の対応する位置にある候補文字の中にない場合、つまり単語を構成する文字のうち認識結果文字列の対応する位置にある第１候補〜第５候補の候補文字の中に同じ文字がない場合、単語を構成する文字のうち認識結果文字列の対応する位置にある第１候補〜第５候補の候補文字の中に同じ文字がない文字について、さらに、類似度による置き換えの要否を判定する。以下、単語を構成する文字のうち認識結果文字列の対応する位置にある第１候補〜第５候補の候補文字の中に同じ文字のない文字のことを、単語を構成する文字のうち候補文字の中に同じ文字がない文字という。

具体的には、置き換え判定部２２は、単語を構成する文字のうち候補文字の中に同じ文字がない文字の特徴量と、認識結果文字列を構成する対応する位置にある候補文字、つまり第１候補の候補文字の特徴量とから、式（３）によって、これらの特徴量の類似度を計算する。認識結果文字列を構成する対応する位置にある候補文字の特徴量は、特徴抽出部１７によって抽出された特徴量であり、メモリ１３に記憶されている。そして、計算した類似度が予め定める閾値以上であるとき、単語を構成する文字のうち候補文字の中に同じ文字がない文字について、置き換えると判定し、計算した類似度が予め定める閾値未満であるとき、単語を構成する文字のうち候補文字の中に同じ文字がない文字について、置き換えないと判定する。単語を構成する文字のうち候補文字の中に同じ文字がある文字については、置き換えると判定する。予め定める閾値は、任意の値を設定することができる。たとえば式（３）で計算される類似度の最大類似度＝１２８の７割の値とする場合、「８９」が予め定める閾値となる。類似度が予め定める閾値以上であることは、予め定める比較基準を満たすことの一例である。

たとえば、図８に示した単語文字列の単語「入居者」は、図８に示した認識結果文字列の中の文字列「入居青」に対応する単語であり、前から順番に１文字ずつ比較していくと、第３文字目が異なっている。この場合、単語文字列の単語「入居者」の第３文字目の文字「者」が、認識結果文字列の対応する第３文字目の候補文字に存在するかをチェックする。図６（ａ）に示した候補文字４３を参照すると、第３文字目の第１候補の候補文字は、文字「者」とは異なる文字「青」であり、また第２候補以降の候補文字に「者」という文字は存在しない。

すなわち、図８に示した例では、２点鎖線４６１で囲まれた文字「青」と文字「者」とが一致せず、単語を構成する文字「者」が、対応する位置にある第１候補〜第５候補の候補文字に存在しないので、置き換え判定部２２は、文字認識辞書１４に収録されている文字「者」の特徴量と、認識結果文字列を構成する対応する候補文字の特徴量とを比較して類似度を計算する。図８に示した例では、認識結果文字列を構成する対応する位置にある候補文字の特徴量とは、図４に示した文字画像４２のうち第３文字目の文字画像が表す文字について、マッチング部１８によって第１候補の候補文字「青」として抽出された文字の特徴量である。特徴抽出部１７によって抽出された特徴量は、メモリ１３に記憶されているので、置き換え判定部２２は、メモリ１３を参照することによって、再度特徴量を計算することなく、特徴抽出部１７によって抽出された特徴量を知ることができる。

図９は、単語文字列の文字の特徴量および対応する位置にある候補文字の特徴量の一例を示す図である。図９（ａ）は、候補文字「青」の特徴量を示す特徴データ３９ａである。候補文字「青」は、図４に示した文字画像４２のうち第３文字目の文字画像が表す文字について、マッチング部１８によって第１候補の候補文字「青」として抽出された文字である。図９（ｂ）は、文字認識辞書１４に収録されている文字「者」の特徴量を示す特徴データ３２ａである。実際の計算は省略するが、候補文字「青」の特徴量と文字認識辞書１４に収録されている文字「者」の特徴量との類似度は、「１０８」である。ここに、類似度の最大値は１２８である。候補文字「青」および文字認識辞書１４に収録されている文字「者」の例では、置き換え判定部２２は、計算した類似度「１０８」が予め定める閾値＝８９以上の類似度であるので、置き換えると判定する。

置き換え判定部２２は、単語文字列を構成する文字のうち候補文字の中に同じ文字がない文字を含むすべての単語について、類似度によって置き換えるか否かを判定する。図８に示した例では、単語文字列を構成する文字のうち候補文字の中に同じ文字がない文字は、文字「者」以外に、文字「保」があり、置き換え判定部２２は、２点鎖線４６２で囲まれた文字「振」および文字「保」についても類似度を計算し、計算した類似度に基づいて、置き換えるか否かを判定する。

図９（ｃ）は、候補文字「振」の特徴量を示す特徴データ３９ｂである。図９（ｄ）は、文字認識辞書１４に収録されている文字「保」の特徴量を示す特徴データ３２ｂである。実際の計算は省略するが、候補文字「振」の特徴量と文字認識辞書１４に収録されている文字「保」の特徴量との類似度は、「１１０」である。置き換え判定部２２は、候補文字「振」の特徴量と文字認識辞書１４に収録されている文字「保」の特徴量との類似度「１１０」が予め定める閾値＝８９以上であるので、置き換えると判定する。

本実施形態では、置き換えるか否かの判定を、類似度が予め定める閾値以上であるときに置き換えると判定したが、これに限定されるものではない。たとえば、候補文字の特徴量と文字認識辞書１４に収録されている文字の特徴量とから計算した類似度と、対象となる文字番目の第１候補文字の類似度との差がＮ以下であるときに、置き換えると判定するようにしてもよい。Ｎは、任意の正の整数である。

置き換え部２３は、認識結果文字列のうち置き換えると判定された文字について、認識結果文字列の文字を単語文字列の文字で置き換え、置き換えた認識結果文字列を出力装置３に送信して出力させる。認識結果文字列のすべての文字について置き換えないと判定されたときは、置き換えを行うことなく、認識結果文字列を出力装置３に送信して出力させる。

たとえば図８に示した例では、２点鎖線４６１で囲まれた文字「青」および文字「者」、ならびに２点鎖線４６２で囲まれた文字「振」および文字「保」はいずれも、置き換え判定部２２によって置き換えると判定されているので、置き換え部２３は、認識結果文字列中の文字「青」を単語文字列中の文字「者」で置き換えるとともに、認識結果文字列中の文字「振」を単語文字列中の文字「保」で置き換える。

２点鎖線４６１で囲まれた文字「青」および文字「者」、ならびに２点鎖線４６２で囲まれた文字「振」および文字「保」以外の文字は、いずれも同じ文字であるので、置き換えると判定されており、置き換え部２３は、認識結果文字列の文字を、単語文字列の同じ文字と置き換える。置き換え部２３は、置き換えた認識結果文字列を出力装置３に送信して、出力させる。

すなわち、認識結果文字列の「入居青」が単語文字列の「入居者」に置き換えられ、認識結果文字列の「振険」が単語文字列の「保険」に置き換えられることになる。したがって、置き換え部２３によって、図６（ｂ）に示した認識結果文字列４４、つまり「入居青の振険医療制度について、」が「入居者の保険医療制度について、」に置き換えられ、置き換えられた認識結果文字列である「入居者の保険医療制度について、」が出力装置３に送られて出力される。

図１０は、情報処理装置１、入力装置２および出力装置３が実行する文字認識処理の処理手順を示すフローチャートである。たとえば、入力装置２に原稿がセットされ、入力装置２の図示しない操作部によって原稿の読み取り指示が行われると、ステップＡ１に移る。

ステップＡ１では、入力装置２は原稿を画像として読込み、読込んだ画像を表す画像データを情報処理装置１に送信する。情報処理装置１では、制御部１１は、入出力制御部１２によって、入力装置２から送信される画像データを受信し、受信した画像データを文字列行切り出し部１５に送る。ステップＡ２では、文字列行切り出し部１５は、制御部１１から受け取った画像データが表す画像から文字列を表す文字列行画像を行ごとに切り出す。ステップＡ３では、文字切り出し部１６は、文字列行切り出し部１５によって切り出された文字列行画像から、文字を１文字ずつ表す矩形画像である文字画像を切り出す。

ステップＡ４では、特徴抽出部１７は、文字切り出し部１６によって切り出された文字画像が表す文字の特徴を数値化した特徴量を抽出する。ステップＡ５では、マッチング部１８は、文字認識辞書１４とのマッチングを行う。具体的には、マッチング部１８は、特徴抽出部１７によって抽出された特徴量と、文字認識辞書１４に収録されているすべての文字の特徴量とを比較して、文字画像が表す文字と文字認識辞書１４に収録された文字との類似度を算出し、算出した類似度に基づいて、文字画像が表す文字の候補文字を少なくとも１つ、たとえば第１候補〜第５候補までの候補文字を抽出する。

ステップＡ６では、文字列生成部１９は、マッチング部１８によって抽出された候補文字のうち、第１候補の候補文字を左から順に並べた認識結果文字列を生成する。ステップＡ７では、後処理部２０は、第１の後処理を行い、文字認識処理を終了する。

図１０に示したステップＡ２は、文字列行切り出し工程に相当し、図１０に示したステップＡ３は、文字切り出し工程に相当し、図１０に示したステップＡ４は、特徴抽出工程に相当し、図１０に示したステップＡ５は、選択工程に相当し、図１０に示したステップＡ６は、文字列生成工程に相当する。

図１１は、後処理部２０が実行する第１の後処理の処理手順を示すフローチャートである。図１０に示したステップＡ７が実行されると、ステップＢ１に移る。

ステップＢ１では、単語列生成部２１は、文字列生成部１９によって生成された認識結果文字列から単語文字列を生成する。具体的には、文字列生成部１９によって生成された認識結果文字列を構成する各文字の複数の候補文字を組み合わせて複数生成される文字列と、単語辞書２４に収録されている単語とを照合して単語の候補を生成し、生成した単語の候補の中から最適な単語を選択し、選択した最適な単語から構成される単語文字列を生成する。

ステップＢ２では、置き換え判定部２２は、単語文字列を構成する単語ごとに、単語を構成する文字列内のすべての文字において、認識結果文字列は存在するか否かを判定する。すなわち、初めてステップＢ２を実行するときは、単語文字列を構成する最初の単語を構成するすべての文字について、第２回目以降にステップＢ２を実行するときは、前回処理した単語の次に単語を構成するすべての文字について、認識結果文字列の対応する位置にある第１候補〜第５候補の中に同じ文字があるか否かを判定する。以下、ステップＢ２で単語文字列を構成する単語のうち処理の対象としている単語のことを「対象としている単語」という。

単語文字列の単語を構成するすべての文字について、認識結果文字列の対応する位置にある第１候補〜第５候補の中に同じ文字があると、単語を構成する文字列内のすべての文字において、認識結果文字列は存在すると判定し、ステップＢ３に進む。単語文字列の単語を構成するいずれかの文字について、認識結果文字列の対応する位置にある第１候補〜第５候補の中に同じ文字がないと、単語を構成する文字列内のすべての文字において、認識結果文字列は存在しないと判定し、ステップＢ５に進む。

置き換え判定部２２は、ステップＢ３に進むときは、認識結果文字列のうち判定が行われた文字について、置き換えると判定する。ステップＢ５に進むときは、単語を構成する文字について、認識結果文字列の対応する位置にある第１候補〜第５候補の中に同じ文字があると判定された文字があるときは、認識結果文字列のうちその判定が行われた文字について、置き換えると判定する。

ステップＢ３では、置き換え部２３は、対象文字について単語文字を出力する。ステップＢ３での対象文字とは、置き換え部２３によって置き換えると判定された文字である。単語文字とは、単語文字列を構成する文字である。ステップＢ３での出力は、メモリ１３に記憶することである。すなわち、置き換え部２３は、対象としている単語のうち、置き換え部２３によって置き換えると判定された文字を、単語文字列の文字で置き換えて、置き換えた単語をメモリ１３に記憶する。このとき、同じ単語の中に置き換えないと判定された文字があるときは、置き換えないと判定された文字については、置き換えは行われない。

ステップＢ４では、単語文字列を構成するすべての単語について処理を行ったか否かを判定する。ステップＢ４での処理とは、ステップＢ２，Ｂ３，Ｂ５〜Ｂ７の処理である。単語文字列を構成するすべての単語について処理を行ったときは、置き換え部２３は、メモリ１３に記憶した単語から構成される認識結果文字列を出力装置３に送信して出力し、第１の後処理を終了する。単語文字列を構成するすべての単語について処理を行っていないときは、ステップＢ２に戻る。

ステップＢ５では、置き換え判定部２２は、単語辞書の文字の特徴量と認識文字の特徴量とを比較する。単語辞書の文字とは、ステップＢ２で、単語文字列の単語を構成する文字のうち候補文字の中に同じ文字がないと判定された文字である。認識文字とは、認識結果文字列を構成する候補文字のうち対応する位置にある候補文字、つまり第１候補の候補文字である。すなわち、ステップＢ５では、置き換え判定部２２は、単語文字列の単語を構成する文字のうち候補文字の中に同じ文字がない文字の特徴量と、認識結果文字列の対応する位置にある第１候補の候補文字の特徴量とを比較する。置き換え判定部２２は、比較のために、単語文字列の単語を構成する文字のうち候補文字の中に同じ文字がない文字の特徴量と、認識結果文字列の対応する位置にある第１候補の候補文字の特徴量との類似度を計算する。

ステップＢ６では、置き換え判定部２２は、特徴量の比較から、予め定める閾値以上の類似性が得られたか否かを判定する。ステップＢ５で計算した類似度が予め定める閾値以上であるとき、特徴量の比較から、予め定める閾値以上の類似性が得られたと判定し、ステップＢ３に進む。ステップＢ５で計算した類似度が予め定める閾値未満であるとき、特徴量の比較から、予め定める閾値以上の類似性が得られなかったと判定し、ステップＢ７に進む。

置き換え判定部２２は、ステップＢ３に進むとき、認識結果文字列のうち予め定める閾値以上の類似性が得られたと判定された文字について、置き換えると判定する。ステップＢ７に進むときは、認識結果文字列のうち予め定める閾値以上の類似性が得られなかったと判定された文字について、置き換えないと判定する。

ステップＢ７では、置き換え部２３は、対象文字について認識文字を出力して、ステップＢ４に進む。ステップＢ７での対象文字とは、置き換え部２３によって置き換えないと判定された文字である。ステップＢ７での出力は、メモリ１３に記憶することである。すなわち、置き換え部２３は、対象としている単語のうち、置き換え部２３によって置き換えないと判定された文字を、単語文字列の文字で置き換えることなく、認対象としている単語をメモリ１３に記憶する。このとき、同じ単語の中に置き換えると判定された文字があるときは、置き換えると判定された文字については、認識結果文字列の文字を単語文字列の文字で置き換える。

図１１に示したステップＢ１は、単語列生成工程に相当し、図１１に示したステップＢ２，Ｂ４〜Ｂ６は、置き換え判定工程に相当し、図１１に示したステップＢ３，Ｂ７は、置き換え工程に相当する。

本実施形態では、置き換え部２３は、置き換えられた文字および置き換えられていない文字から構成される単語を一旦メモリ１３に記憶し、すべての単語について処理が行われた後、メモリ１３に記憶した単語から認識結果文字列を構成して、出力装置３に送信して出力したが、メモリ１３に記憶することなく、ステップＢ３あるいはステップＢ７で、置き換えられた文字および置き換えられていない文字から構成される単語を、単語ごとに出力装置３に送信して出力する構成としてもよい。

次に、本発明の第２の実施形態である情報処理装置１ａについて説明する。本発明に係る情報処理方法は、情報処理装置１ａによって実行される。情報処理装置１ａの構成は、後処理部２０ａを除き、図１に示した情報処理装置１の構成と同じであり、重複を避けるために、以下相違する部分についてのみ説明する。後処理部２０ａが実行する処理を、以下第２の後処理という。後処理部２０ａは、置き換え判定部２２ａを除き、図１に示した後処理部２０の構成と同じであり、重複を避けるために、以下相違する部分についてのみ説明する。

置き換え判定部２２ａは、最初、単語列生成部２１により生成された単語文字列を構成する単語について類似単語が抽出されていたか否かをメモリ１３に記憶する。類似単語は、単語列生成部２１によって単語文字列が生成される際、単語の候補が複数生成されたとき、その複数の単語の候補のうち類似度が最も高い単語の候補を除く残余の単語の候補のことである。この処理は、第１の実施形態の置き換え判定部２２では行われなかった処理である。

次に、置き換え判定部２２ａは、第１の実施形態の置き換え判定部２２と同様に、単語文字列の単語を構成する文字と同じ文字が、認識結果文字列の対応する位置にある候補文字の中にあるか否かを判定する。単語文字列の単語を構成する文字と同じ文字が、認識結果文字列の対応する位置にある候補文字の中にすべてある場合、置き換え判定部２２は、単語を構成するすべての文字について、置き換えると判定する。

単語を構成する文字のうち認識結果文字列の対応する位置にある候補文字の中に同じ文字がない場合、置き換え判定部２２ａは、第１の実施形態の置き換え判定部２２と同様に、単語を構成する文字のうち候補文字の中に同じ文字がない文字の特徴量と、認識結果文字列を構成する対応する候補文字、つまり第１候補の候補文字の特徴量とから、式（３）によって、これらの特徴量の類似度を計算する。そして、計算した類似度が予め定める閾値以上であるとき、単語を構成する文字のうち候補文字の中に同じ文字がない文字に対応する位置にある認識結果文字列の文字について、置き換えると判定する。

計算した類似度が予め定める閾値未満であるとき、置き換え判定部２２ａは、第１の実施形態の置き換え判定部２２とは異なり、さらに、計算した類似度が予め定める閾値未満であると判定された文字を含む単語に類似単語があるか否かを、メモリ１３を参照して判定する。計算した類似度が予め定める閾値未満であると判定された文字を含む単語に類似単語がない場合、計算した類似度が予め定める閾値未満であると判定された文字を含む単語は、類似度が高い場合と同様に確信度が高いと判定し、置き換えると判定する。計算した類似度が予め定める閾値未満であると判定された文字を含む単語に類似単語がある場合、置き換えないと判定する。
以下、具体的な例示として、図３に示した文字列行画像４１２を用いて、第２の実施形態である情報処理装置１ａの処理を説明する。

図１２は、文字切り出し部１６によって切り出された文字画像５２の一例を示す図である。文字切り出し部１６は、文字列行切り出し部１５によって切り出された文字列行画像から、文字を１文字ずつ矩形画像として切り出す。図１２に示した文字画像５２の例には、図３に示した文字列行画像４１２から切り出された２２文字の文字画像が示されている。最初の文字画像５２１は、「協」という文字を切り出した文字画像であり、第２番目以降に「力」、「，」、「理」、「解」、「を」、「得」、「る」、「た」、「め」、「に」、「事」、「前」、「に」、「説」、「明」、「会」、「を」、「行」、「っ」、「た」および「。」の各文字の文字画像が示されている。

図１３は、候補文字５３および認識結果文字列５４の一例を示す図である。図１３（ａ）は、マッチング部１８によって抽出された候補文字５３の一例を示す。候補文字５３は、文字画像５２が表す文字として、マッチング部１８によって抽出された候補文字である。図１３（ａ）に示した候補文字５３の例では、最上段に入力文字、つまり候補文字の正解文字として、「協」、「力」、「，」、「理」、「解」、「を」、「得」、「る」、「た」、「め」、「に」、「事」、「前」、「に」、「説」、「明」、「会」、「を」、「行」、「っ」、「た」および「。」が示されている。第１候補〜第５候補については、たとえば正解文字「協」については、第１候補「協１２１」、第２候補「脇１１８」、第３候補「摺１１０」、第４候補「堪１０８」および第５候補「洋１０４」が示されている。

図１３（ｂ）は、文字列生成部１９によって生成された認識結果文字列５４の一例を示す。文字列生成部１９は、マッチング部１８によって抽出された候補文字５３に示される候補文字のうち、第１候補の文字を左から順に並べた認識結果文字列５４を生成する。文字列生成部１９は、後処理部２０ａのために、候補文字４３をメモリ１３に記憶しておく。図１３（ｂ）に示した例では、認識結果文字列５４として「協力，埋斛を得るあめに事間に説明会を行った。」なる文字列が示されている。後処理部２０ａによる処理を行わない場合は、この認識結果文字列５４を、認識結果として出力することになる。本実施形態では、この後、後処理部２０ａによって第２の後処理が実行される。

第２の後処理では、まず、単語列生成部２１は、第１の実施形態と同様に、認識結果文字列の第１文字目から順に、各候補文字について、単語辞書２４に収録されている単語に完全に一致する文字列、もしくは部分的に一致する文字列を単語の候補として生成する。このようにして生成された単語文字列の例を、図１４に示す。

第２の実施形態では、第１の実施形態とは異なり、単語列生成部２１は、単語の候補が複数生成されたか否かを，後処理部２０ａのために，メモリ１３に記憶しておく。具体的には、生成した単語文字列に含まれる単語の候補が、複数の単語の候補が生成された単語の候補の１つである場合は、類似単語が抽出されたことをメモリ１３に記憶し、生成した単語文字列に含まれる単語の候補が、１つの単語の候補しか生成されなかった単語の候補である場合は、類似単語が抽出されないことをメモリ１３に記憶する。類似単語は、生成した複数の単語の候補のうち生成した単語文字列に含まれない単語の候補のことである。

図１４は、単語列生成部２１によって生成された単語文字列５５の一例を示す図である。図１４に示した単語文字列５５の例には、最適な単語たとえば単語５５１、および複数生成された単語の候補たとえば単語の候補５５２，５５３が混在している。単語の候補５５２には、２つの単語の候補「得る」および「得ろ」が生成され、単語の候補５５３には、２つの単語の候補「事前」および「専門」が生成されている。

次に、単語列生成部２１は、単語文字列５５のうち複数の単語の候補があるものについて最適な単語を選択し、最適な単語の候補のみからなる単語文字列を生成する。図１４に示した例では、単語の候補５５２、５５３に複数の単語の候補があるので、単語列生成部２１は、第１の実施形態と同じ３つの条件で優先順位をつけて、最適な単語を選択する。

たとえば図１４に示した例では、単語の候補５５２「得る」および「得ろ」は、ともに条件１を満たすので、条件３によって最適な単語を選択する。「得る」および「得ろ」のうち、「得る」の方が類似度が大きいので、「得る」が選択される。「事前」および「専門」については、「事前」は条件１を満たすが、「専門」は条件１を満たさず、条件２を満たすので、優先順位の高い条件を満たす「事前」が選択される。

図１５は、認識結果文字列と単語文字列との比較例５６を示す図である。比較例５６は、上段が文字列生成部１９によって生成された認識結果文字列であり、下段が単語列生成部２１によって生成された単語文字列である。図１５に示した下段の単語文字列は、図１４に示した単語文字列５５で最適な単語として選択された単語からなる文字列である。比較例５６は、単語文字列の各々の単語を構成する文字数で区切った矩形によって、認識結果文字列と単語文字列とを区切って示している。

続いて、置き換え判定部２２ａは、文字列生成部１９で生成された認識結果文字列と単語列生成部２１により生成された単語文字列とを、単語ごとに先頭文字から一文字ずつ比較して、置き換えるか否かを判定する。置き換えるか否かの判定は、以下を除き、第１の実施形態と同じである。

第１の実施形態では、置き換え判定部２２は、計算した類似度が予め定める閾値未満であるとき、単語を構成する文字のうち候補文字の中に同じ文字がない文字について、置き換えないと判定したが、第２の実施形態では、置き換え判定部２２ａは、計算した類似度が予め定める閾値未満であるとき、類似単語が抽出されたか否かを判定する。置き換え判定部２２ａは、メモリ１３を参照し、メモリ１３に類似単語が抽出されたことが記憶されていないと、置き換えると判定し、メモリ１３に類似単語が抽出されたことが記憶されていると、置き換えないと判定する。

たとえば図１５に示した例について、置き換え判定部２２ａによる置き換えるか否かの判定を説明する。前から順番に文字を比較していくと第４文字目と第５文字目、つまり２点鎖線５６１で囲んだ部分にある文字が異なる。すなわち、認識結果文字列では「埋斛」であり、単語文字列では「理解」である。この実施形態では、認識結果文字列と単語文字列とを前から順番に比較するが、後ろから順番に比較するような構成でもよい。

置き換え判定部２２ａは、まず単語文字列中の第４文字目の「理」という文字が、認識結果文字列の対応する位置にある候補文字に存在するか否かをチェックする。図１３（ａ）に示した候補文字５３には、第４文字目の第２候補の候補文字に「理」という文字がある。したがって、「理」という文字は候補文字にあるので、「理」という文字については、それ以上の処理は行わない。次に、第５文字目の「解」という文字が、認識結果文字列の対応する位置にある候補文字に存在するか否かをチェックする。図１３（ａ）に示した候補文字５３には、第５文字目の第１候補の候補文字は「斛」であり、第２候補の候補文字以降にも「解」という文字は存在しない。

単語「理解」を構成する「解」という文字が認識結果文字列の候補文字の中に含まれていないので、置き換え判定部２２ａは、次に、類似度による置き換えるか否かの判定を行う。このとき、仮に、単語「理解」のすべての文字が認識結果文字列の候補文字に含まれている場合は、置き換えると判定する。

置き換え判定部２２ａは、単語文字列中の文字「解」が、認識結果文字列内の対応する位置にある候補文字に存在しないので、文字認識辞書１４に収録されている文字「解」の特徴量と、図１２に示した文字画像５２のうち第５文字目の文字画像から抽出された特徴量とを比較して、類似度を抽出する。図１２に示した文字画像５２のうち第５文字目の文字画像から抽出された特徴量は、メモリ１３に記憶されている。

図１６は、単語文字列の文字の特徴量および対応する位置にある候補文字の特徴量の一例を示す図である。図１６（ａ）は、候補文字「斛」の特徴量を示す特徴データ３９ｃである。候補文字「斛」は、図１２に示した文字画像５２のうち第５文字目の文字画像が表す文字について、マッチング部１８によって第１候補の候補文字「斛」として抽出された文字である。図１６（ｂ）は、文字認識辞書１４に収録されている文字「解」の特徴量を示す特徴データ３２ｃである。式（３）による実際の計算は省略するが、候補文字「斛」の特徴量と文字認識辞書１４に収録されている文字「解」の特徴量との類似度は、「１１２」である。ここに、類似度の最大値は１２８である。

予め定める閾値は、任意の値として設定可能であるが、たとえば予め定める閾値を第１候補の候補文字との類似度の差が５以内であるとする場合、第５文字目の第１候補の候補文字は「斛」であり、文字「斛」の類似度は、図１３（ａ）に「１１９」と示されているので、予め定める閾値は「１１９」から「５」を減算した「１１４」になる。第５文字目に対応する文字画像と文字「解」との類似度「１１２」は、予め定める閾値＝１１４未満であり、類似単語の有無の判定が行われる。予め定める閾値以上の類似度である場合は置き換えると判定される。

類似単語の有無の判定では、置き換え判定部２２ａは、「理解」という単語のほかに類似単語が抽出されていたか否かを、メモリ１３を参照して判定する。類似単語が抽出されたことがメモリ１３に記憶されていなければ、「埋斛」という文字列に対して、「理解」という単語は確信度が高いとして、予め定める閾値以上の類似度であったときと同じ処理を行うと判断し、置き換えると判定する。もし、類似単語が抽出されたことがメモリ１３に記憶されていれば、「埋斛」という文字列に対して、「理解」という単語は確信度が高くないとして、予め定める閾値未満の類似度であったときと同じ処理を行うと判断し、置き換えないと判定する。

第２の実施形態では、類似単語が抽出されたことがメモリ１３に記憶されていなければ、無条件に確信度が高いとしたが、無条件に確信度が高いとするのではなく、文字画像と文字「解」との類似度を判定する予め定める閾値を最大類似度＝１２８の５割に再設定するなどして、予め定める閾値を低く設定し直して判定する構成としてもよい。

第２の後処理では、最後に、置き換え部２３は、第１の実施形態と同様に、認識結果文字列のうち置き換えると判定された文字について、認識結果文字列の文字を単語文字列の文字で置き換え、置き換えた認識結果文字列を出力装置３に送信して出力させる。認識結果文字列のすべての文字について置き換えないと判定されたときは、置き換えを行うことなく、認識結果文字列を出力装置３に送信して出力させる。

図１５に示した単語文字列のうち「理解」という単語は、類似単語が抽出されたことがメモリ１３に記憶されていないので、図１５に示した認識結果文字列のうち「埋斛」という文字列に対して、「理解」という単語は確信度が高いとして、予め定める閾値以上の類似度であったときと同様に、置き換えると判定される。したがって、置き換え部２３は、認識結果文字列のうち「埋斛」という文字列を、単語文字列中の「理解」という単語に置き換えて、出力装置３に送信して出力する。すなわち、単語文字列中の単語「理解」を出力することによって、「埋斛」として誤認識された単語を正しくコレクト、つまり修正することができる。

図１５に示した例では、認識結果文字列中の「埋斛」の「埋」と単語文字列中の「理解」の「理」と以外に、認識結果文字列中の「あめに」の「あ」と単語文字列中の「ために」の「た」と、また、認識結果文字列中の「事間」の「間」と単語文字列中の「事前」の「前」との文字がそれぞれ異なるので、類似度による置き換えの要否が判定される。

これらの比較結果についての説明は省略するが、第２の実施形態においては、仮に認識結果文字列中の文字と単語文字列中の文字とが異なって、類似度が予め定める閾値未満であったとしても、単語文字列を構成する単語の確信度が高ければ、無条件に認識結果文字列中の文字を単語文字列中の文字で置き換えることよって、正しい認識結果を得ることができる。あるいは、仮に認識結果文字列中の文字と単語文字列中の文字とが異なって、類似度が予め定める閾値未満であったとしても、予め定める閾値を低く設定し直して、類似度が設定し直した予め定める閾値以上であるとき、単語文字列を構成する単語の確信度が高いとして、認識結果文字列中の文字を単語文字列中の文字で置き換えることによって、正しい認識結果を得ることができる。

図１７は、後処理部２０ａが実行する第２の後処理の処理手順を示すフローチャートである。情報処理装置１ａ、入力装置２および出力装置３が実行する文字認識処理は、情報処理装置１、入力装置２および出力装置３が実行する文字認識処理と同じであり、重複を避けるために説明は省略する。第２の実施形態では、図１０に示したステップＡ７が実行されると、ステップＣ１に移る。ステップＣ１，Ｃ３〜Ｃ６，Ｃ９は、それぞれ図１１に示したステップＢ１〜Ｂ５，Ｂ７と同じであり、説明は省略する。

ステップＣ２では、単語列生成部２１は、生成した単語文字列を構成する単語において類似単語が抽出されたか否かを、生成した単語文字列を構成する単語ごとに、メモリ１３に記憶する。すなわち、生成した単語文字列に含まれる単語が、生成された複数の単語の候補の中の１つの単語の候補であるとき、類似単語が抽出されたことをメモリ１３に記憶し、生成した単語文字列に含まれる単語が、１つのみ生成された単語の候補であるとき、類似単語が抽出されないことをメモリ１３に記憶する。

ステップＣ７では、置き換え判定部２２ａは、特徴量の比較から、予め定める閾値以上の類似性が得られたか否かを判定する。ステップＣ６で計算した類似度が予め定める閾値以上であるとき、特徴量の比較から、予め定める閾値以上の類似性が得られたと判定し、ステップＣ４に進む。ステップＣ６で計算した類似度が予め定める閾値未満であるとき、特徴量の比較から、予め定める閾値以上の類似性が得られなかったと判定し、ステップＣ８に進む。

予め定める閾値は、任意の値として設定可能であるが、本実施形態では、たとえば予め定める閾値は、第１候補の候補文字との類似度から「５」を減算した値である。図１６（ａ）に示した例では、第５文字目の第１候補の候補文字は「斛」であり、文字「斛」の類似度は、図１３（ａ）に「１１９」と示されているので、予め定める閾値は「１１４」になる。

ステップＣ８では、置き換え判定部２２ａは、対象としている単語について、ステップＣ２において類似単語が抽出されたか否かを判定する。対象としている単語、つまり単語文字列のうちステップＣ３で処理の対象としている単語について、メモリ１３に類似単語が抽出されたことが記憶されていると、ステップＣ９に進み、対象としている単語について、メモリ１３に類似単語が抽出されていないことが記憶されていると、ステップＣ４に進む。置き換え判定部２２ａは、ステップＣ４に進むとき、認識結果文字列のうち予め定める閾値以上の類似性が得られたと判定された文字について、置き換えると判定する。ステップＣ９に進むときは、認識結果文字列のうち予め定める閾値以上の類似性が得られなかったと判定された文字について、置き換えないと判定する。

図１７に示したステップＣ１，Ｃ２は、単語列生成工程に相当し、図１７に示したステップＣ３，Ｃ５〜Ｃ８は、置き換え判定工程に相当し、図１７に示したステップＣ４，Ｃ９は、置き換え工程に相当する。

次に、本発明の第３の実施形態である情報処理装置１ｂについて説明する。本発明に係る情報処理方法は、情報処理装置１ｂによって実行される。情報処理装置１ｂの構成は、後処理部２０ｂを除き、図１に示した情報処理装置１の構成と同じであり、重複を避けるために、以下相違する部分についてのみ説明する。後処理部２０ｂが実行する処理を、以下第３の後処理という。後処理部２０ｂは、置き換え判定部２２ｂを除き、図１に示した後処理部２０の構成と同じであり、重複を避けるために、以下相違する部分についてのみ説明する。

置き換え判定部２２ｂは、最初、第１の実施形態の置き換え判定部２２と同様に、単語文字列の単語を構成する文字と同じ文字が、認識結果文字列の対応する位置にある候補文字の中にあるか否かを判定する。単語文字列の単語を構成する文字と同じ文字が、認識結果文字列の対応する位置にある候補文字の中にすべてある場合、置き換え判定部２２は、単語を構成するすべての文字について、置き換えると判定する。

単語を構成する文字のうち認識結果文字列の対応する位置にある候補文字の中に同じ文字がない場合、置き換え判定部２２ｂは、第１の実施形態の置き換え判定部２２と同様に、単語を構成する文字のうち候補文字の中に同じ文字がない文字の特徴量と、認識結果文字列を構成する対応する候補文字、つまり第１候補の候補文字の特徴量とから、式（３）によって、これらの特徴量の類似度を計算する。そして、計算した類似度が予め定める閾値以上であるとき、単語を構成する文字のうち候補文字の中に同じ文字がない文字に対応する位置にある認識結果文字列の文字について、置き換えると判定する。

計算した類似度が予め定める閾値未満であるとき、置き換え判定部２２ｂは、第１の実施形態の置き換え判定部２２とは異なり、さらに、対象としている単語の文字数が予め定める基準文字数以上か否かを判定する。対象としている単語は、単語文字列を構成する単語のうち類似度を判定している文字を含む単語である。予め定める基準文字数以上でない場合、置き換えないと判定する。

予め定める基準文字数以上である場合、予め定める閾値を低めに設定し直し、類似度が設定し直した予め定める閾値以上であるとき、置き換えると判定する。これは、文字数が長い文字列の場合に、単語辞書２４に収録される単語と完全に一致もしくは部分一致して照合できるということは、単語文字列の単語として選択された単語が最適である確度が高いと考えられ、予め定める基準文字数以上の単語については、類似度の判定に使用する予め定める閾値を低めに設定しなおす。類似度が設定し直した予め定める閾値未満であるとき、置き換えないと判定する。

図１８は、入力装置２から受信した画像データが表す画像６０の一例を示す図である。入力装置２から受信した画像データが表す画像６０は、文字列行が記載された原稿を入力装置２によって読み取った画像である。画像６０には、文字列行が表示されている。図１３に示した画像６０の例には、１行の文字列行「車庫証明の取得後、提出する必要がある。」が表示されている。

以下、第３の実施形態の具体的な例示として、図１８に示した画像６０を用いて、情報処理装置１ｂの処理を説明する。

図１９は、文字列行切り出し部１５によって切り出された文字列行画像６１の一例を示す図である。文字列行切り出し部１５は、制御部１１が入出力制御部１２によって入力装置２から受信した画像データを制御部１１から受け取り、受け取った画像データが表す画像から文字列を表す文字列行画像を行ごとに切り出す。図１９に示した文字列行画像６１の例には、文字列行画像６１１の１つの文字列行画像が示されている。文字列行画像６１１は、「車庫証明の取得後、提出する必要がある。」という文字列が表示された画像である。

図２０は、文字切り出し部１６によって切り出された文字画像６２の一例を示す図である。文字切り出し部１６は、文字列行切り出し部１５によって切り出された文字列行画像から、文字を１文字ずつ矩形画像として切り出す。図２０に示した文字画像６２の例には、１９文字の文字画像が示されている。最初の文字画像６２１は、「車」という文字を切り出した文字画像であり、第２番目以降に「庫」、「証」、「明」、「の」、「取」、「得」、「後」、「、」、「提」、「出」、「す」、「る」、「必」、「要」、「が」、「あ」、「る」および「。」の各文字の文字画像が示されている。

図２１は、候補文字６３および認識結果文字列６４の一例を示す図である。図２１（ａ）は、マッチング部１８によって抽出された候補文字６３の一例を示す。候補文字６３は、文字画像６２が表す文字として、マッチング部１８によって抽出された候補文字である。図２１（ａ）に示した候補文字５３の例では、最上段に入力文字、つまり候補文字の正解文字として、「車」、「庫」、「証」、「明」、「の」、「取」、「得」、「後」、「、」、「提」、「出」、「す」、「る」、「必」、「要」、「が」、「あ」、「る」および「。」が示されている。第１候補〜第５候補については、たとえば正解文字「車」については、第１候補「事１２３」、第２候補「専１２０」、第３候補「実１１９」、および第４候補「要１１８」が示され、第５候補は空白である。

図２１（ｂ）は、文字列生成部１９によって生成された認識結果文字列６４の一例を示す。文字列生成部１９は、マッチング部１８によって抽出された候補文字６３に示される候補文字のうち、第１候補の文字を左から順に並べた認識結果文字列６４を生成する。文字列生成部１９は、後処理部２０ｂのために、候補文字６３をメモリ１３に記憶しておく。図２１（ｂ）に示した例では、認識結果文字列６４として「事庫証明の取得後、提出する必要がある。」なる文字列が示されている。後処理部２０ｂによる処理を行わない場合は、この認識結果文字列６４を、認識結果として出力することになる。本実施形態では、この後、後処理部２０ｂによって第３の後処理が実行される。

第３の後処理では、まず、単語列生成部２１は、第１の実施形態と同様に、認識結果文字列の第１文字目から順に、各候補文字について、単語辞書２４に収録されている単語に完全に一致する文字列、もしくは部分的に一致する文字列を単語の候補として生成する。このようにして生成された単語文字列の例を、図２２に示す。

図２２は、単語列生成部２１によって生成された単語文字列６５の一例を示す図である。図２２に示した単語文字列６５の例には、最適な単語たとえば単語６５１からなる単語文字列が示されている。単語文字列６５には、複数の単語の候補は示されていない。単語列生成部２１は、図２１（ｂ）に示した認識結果文字列６４のうち第１文字目から第４文字目の文字列「事庫証明」について、単語辞書２４に「車庫証明」という単語が収録されていれば、この「車庫証明」は「事庫証明」とは第１文字目の「車」と「事」とのみが異なる部分的に一致する文字列だと判断し、「事庫証明」に対応する単語として「車庫証明」を抽出する。他にも「事故」あるいは「車庫」といった単語を抽出することができるが、どれも完全一致ではなく、また「車庫証明」よりも文字列長が短いので、最終的には、文字列長の最も長い「車庫証明」のみを抽出する。「車庫証明」は部分一致の単語として抽出される。

図２３は、認識結果文字列と単語文字列との比較例６６を示す図である。比較例６６は、上段が文字列生成部１９によって生成された認識結果文字列であり、下段が単語列生成部２１によって生成された単語文字列である。図２３に示した下段の単語文字列は、図２２に示した単語文字列６５で最適な単語として選択された単語からなる文字列である。比較例６６は、単語文字列の各々の単語を構成する文字数で区切った矩形によって、認識結果文字列と単語文字列とを区切って示している。

続いて、置き換え判定部２２ｂは、文字列生成部１９で生成された認識結果文字列と単語列生成部２１により生成された単語文字列とを、単語ごとに先頭文字から一文字ずつ比較して、置き換えるか否かを判定する。置き換えるか否かの判定は、以下を除き、第１の実施形態と同じである。

第１の実施形態では、置き換え判定部２２は、計算した類似度が予め定める閾値未満であるとき、単語を構成する文字のうち候補文字の中に同じ文字がない文字について、置き換えないと判定したが、第３の実施形態では、置き換え判定部２２ｂは、計算した類似度が予め定める閾値未満であるとき、さらに、対象としている単語の文字数が予め定める基準文字数以上か否かを判定する。置き換え判定部２２ｂは、対象としている単語の文字数が予め定める基準文字数以上でない場合、置き換えないと判定する。対象としている単語の文字数が予め定める基準文字数以上である場合、予め定める閾値を低めに設定し直し、類似度が設定し直した予め定める閾値以上であるとき、置き換えると判定し、類似度が設定し直した予め定める閾値以上でないとき、置き換えないと判定する。

たとえば図２３に示した例について、置き換え判定部２２ｂによる置き換えるか否かの判定を説明する。図２３に示した単語文字列の単語「車庫証明」は、図２３に示した認識結果文字列の単語「事庫証明」に対応し、前から順番に文字を１文字ずつ比較していくと、第１文字目が異なる。置き換え判定部２２ｂは、単語辞書２４から得られた「車」という文字が、認識結果文字列の対応する位置にある候補文字に存在するかをチェックする。この実施形態では、認識結果文字列と単語文字列とを前から順番に比較するが、後ろから順番に比較するような構成でもよい。

図２１（ａ）に示した候補文字６３には、認識結果文字列の第１文字目の第１候補の候補文字「事」が示され、第２候補以下の候補文字以降にも「車」いう文字は存在しない。単語文字列の単語「車庫証明」の「車」が認識結果文字列の候補文字に含まれていない、つまり存在しないので、置き換え判定部２２ｂは、類似度による置き換えるか否かの判定を行う。このとき、仮に、単語文字列の単語「車庫証明」のすべての文字が認識結果文字列の候補文字に含まれている場合は、置き換え判定部２２ｂは、置き換えると判定する。

置き換え判定部２２ｂは、認識結果文字列中の文字と単語文字列中の文字とに異なる文字があった場合、認識結果文字列中の文字の特徴量と単語文字列中の文字の特徴量とを比較して、類似度を抽出する。たとえば、図２３に示した２点鎖線６６１によって囲んだ文字「事」と文字「車」とが異なるので、文字認識辞書１４に収録されている文字「車」の特徴量と、認識結果文字列の第１文字目の文字画像から抽出された特徴量とを比較して類似度を抽出する。認識結果文字列の第１文字目の文字画像から抽出された特徴量、つまり図２０に示した文字画像６２のうち第１文字目の文字画像６２１から抽出された特徴量は、メモリ１３に記憶されている。

図２４は、単語文字列の文字の特徴量および対応する位置にある候補文字の特徴量の一例を示す図である。図２４（ａ）は、候補文字「事」の特徴量を示す特徴データ３９ｄである。候補文字「事」は、図２０に示した文字画像６２のうち第１文字目の文字画像６２１が表す文字について、マッチング部１８によって第１候補の候補文字「事」として抽出された文字である。図２４（ｂ）は、文字認識辞書１４に収録されている文字「車」の特徴量を示す特徴データ３２ｄである。式（３）による実際の計算は省略するが、候補文字「事」の特徴量と文字認識辞書１４に収録されている文字「車」の特徴量との類似度は、「１１６」である。ここに、類似度の最大値は１２８である。

予め定める閾値は、任意の値として設定可能であるが、たとえば予め定める閾値を第１候補の候補文字との類似度の差が５以内であるとする場合、第１文字目の第１候補の候補文字は「事」であり、文字「事」の類似度は、図２１（ａ）に「１２３」と示されているので、予め定める閾値は「１２３」から「５」を減算した「１１８」になる。第１文字目に対応する文字画像と文字「車」との類似度「１１６」は、予め定める閾値「１１８」未満であり、文字数の判定が行われる。予め定める閾値以上の類似度である場合は、置き換えると判定される。

文字数の判定では、置き換え判定部２２ｂは、対象としている単語の文字数が予め定める基準文字数以上であるか否かを判定する。対象としている単語の文字数が予め定める基準文字数以上でない場合、置き換え判定部２２ｂは、置き換えないと判定する。文字数が長い文字列の場合、単語辞書２４に収録された単語と完全に一致もしくは部分一致して照合することができるということは、抽出した単語が最適である確度が高いと考えられ、予め定める基準文字数以上の単語については、類似度の判定に使用する予め定める閾値を低めに設定し直す。

予め定める基準文字数は、たとえば「４」であり、設定し直した予め定める閾値は、第１候補の候補文字の類似度から「１０」を減算した値、あるいは最大類似度＝１２８の８割、たとえば１０２とする。置き換え判定部２２ｂは、類似度が設定し直した予め定める閾値以上であると、置き換えると判定し、類似度が設定し直した予め定める閾値未満であると、置き換えないと判定する。

図２３に示した第１文字目の例では、設定し直した予め定める閾値を、第１候補の候補文字の類似度から「１０」を減算した値とする場合、設定し直した予め定める閾値は「１１３」であり、第１文字目に対応する文字画像と文字「車」との類似度「１１６」は、設定し直した予め定める閾値以上であり、置き換え判定部２２ｂは、置き換えると判定する。

第３の後処理では、最後に、置き換え部２３は、第１の実施形態と同様に、認識結果文字列のうち置き換えると判定された文字について、認識結果文字列の文字を単語文字列の文字で置き換え、置き換えた認識結果文字列を出力装置３に送信して出力させる。認識結果文字列のすべての文字について置き換えないと判定されたときは、置き換えを行うことなく、認識結果文字列を出力装置３に送信して出力させる。

図２３に示した認識結果文字列のうち単語「事庫証明」の「事」が、置き換えると判定されるので、置き換え部２３は、認識結果文字列の単語「事庫証明」の「事」を単語文字列の「車庫証明」の「車」で置き換え、置き換えた単語「車庫証明」を出力装置３に送信して出力させる。すなわち、認識結果文字列を構成する単語のうち誤認識された単語「事庫証明」の「事」を、単語文字列の「車庫証明」の「車」でコレクト、つまり修正して出力することができる。したがって、情報処理装置１ｂは、「車庫証明の取得後、提出する必要がある。」という文字列を認識結果として出力することができる。

図２５は、後処理部２０ｂが実行する第３の後処理の処理手順を示すフローチャートである。情報処理装置１ｂ、入力装置２および出力装置３が実行する文字認識処理は、情報処理装置１、入力装置２および出力装置３が実行する文字認識処理と同じであり、重複を避けるために説明は省略する。第３の実施形態では、図１０に示したステップＡ７が実行されると、ステップＤ１に移る。ステップＤ１〜Ｄ５，Ｄ１０は、それぞれ図１１に示したステップＢ１〜Ｂ５，Ｂ７と同じであり、説明は省略する。

ステップＤ６では、置き換え判定部２２ｂは、特徴量の比較から、予め定める閾値以上の類似性が得られたか否かを判定する。ステップＤ５で計算した類似度が予め定める閾値以上であるとき、特徴量の比較から、予め定める閾値以上の類似性が得られたと判定し、ステップＤ３に進む。ステップＤ５で計算した類似度が予め定める閾値未満であるとき、特徴量の比較から、予め定める閾値以上の類似性が得られなかったと判定し、ステップＤ７に進む。

ステップＤ７では、置き換え判定部２２ｂは、対象としている単語の文字数が予め定める基準文字数Ｍ以上であるか否かを判定する。対象としている単語の文字数が予め定める基準文字数Ｍ以上であるとき、ステップＤ８に進み、対象としている単語の文字数が予め定める基準文字数Ｍ未満であるとき、ステップＤ１０に進む。置き換え判定部２２ｂは、ステップＤ１０に進むとき、置き換えないと判定する。ステップＤ８では、置き換え判定部２２ｂは、予め定める閾値を低い値に再設定する。

ステップＤ９では、置き換え判定部２２ｂは、類似度が再設定した予め定める閾値以上であるか否かを判定する。類似度が再設定した予め定める閾値以上であるとき、ステップＤ３に進み、類似度が再設定した予め定める閾値未満であるとき、ステップＤ１０に進む。置き換え判定部２２ｂは、ステップＤ３に進むとき、置き換えると判定し、ステップＤ１０に進むとき、置き換えないと判定する。

図２５に示したステップＤ１は、単語列生成工程に相当し、図２５に示したステップＤ２，Ｄ４〜Ｄ９は、置き換え判定工程に相当し、図２５に示したステップＤ３，Ｄ１０は、置き換え工程に相当する。

このように、上述した第１〜３の実施形態では、文字認識辞書１４および単語辞書２４以外の辞書、たとえば類似性文字辞書などの他の辞書を用いることなく、簡単な処理で、認識文字列内の誤りを正しい文字に訂正することができる。文字認識辞書１４および単語辞書２４以外の辞書を必要としないので、記憶容量の増加を回避することができる。

また、上述した第１〜３の実施形態では、認識結果文字列中の文字と単語文字列中の文字とが異なる場合に、異なっている文字について、認識結果文字列中の対応する文字番目の文字画像から抽出される特徴データと、単語文字列中の文字に対応する文字認識辞書内の特徴データとから算出される類似度によって、認識結果文字列中の文字を単語文字列中の文字で置き換えるか否かを判定する構成としたが、これに限定されるものではない。たとえば、認識結果文字列中の第１候補の候補文字に対応する文字認識辞書１４に収録される文字の特徴データと、単語文字列中の文字に対応する文字認識辞書１４に収録される文字の特徴データとから算出される類似度によって、認識結果文字列中の文字を単語文字列中の文字で置き換える構成とすることもできる。

また、上述した第１〜３の実施形態では、文字の特徴量を比較して、文字同士がどれだけ似ているかを数値化した類似度として、単純類似度を用いたが、これに限定されるものではなく、たとえば単純類似度からさらに計算することによって算出される複合類似度を用いることも可能である。

また、上述した第１〜３の実施形態では、文章が記載された原稿を読込み、読込んだ原稿の画像にあらわされる文章の文字列を単語に分割して、コレクト処理を行う例を示したが、これに限定されるものではない。たとえば、住所を記載した文字列を読込み、単語辞書を住所辞書に置き換えてコレクト処理を行う際にも、適用可能であり、誤認識した住所を正しい住所にコレクト、つまり修正することが可能である。単語辞書を住所辞書に置き換えて、住所の文字列に適用してコレクト処理を行う場合にも、類似性文字辞書などの他の辞書を必要としないので、メモリ１３の追加容量を必要とせず、また簡単な方法で正しいコレクト処理を行うことができる。

上述した実施の形態では、入出力制御部１２を制御するとともに、文字列行切り出し部１５、文字切り出し部１６、特徴抽出部１７、マッチング部１８、文字列生成部１９および後処理部２０，２０ａ，２０ｂなどの機能を実現するプログラムは、情報処理装置１，１ａ，１ｂのメモリ１３などの記憶装置に記憶されるが、この記憶装置に限定されるものではなく、コンピュータで読取り可能な記録媒体に記録されていてもよい。記録媒体は、たとえば図示しない外部記憶装置としてプログラム読取装置を情報処理装置１，１ａ，１ｂに設け、そこに記録媒体を挿入することによって読取り可能な記録媒体であってもよいし、あるいは他の装置の記憶装置であってもよい。

いずれの記録媒体であっても、記憶されているプログラムがコンピュータからアクセスされて実行される構成であればよい。あるいはいずれの記録媒体であっても、プログラムが読み出され、読み出されたプログラムが、記憶装置のプログラム記憶エリアに記憶されて、そのプログラムが実行される構成であってもよい。

情報処理装置１，１ａ，１ｂと分離可能に構成される記録媒体は、たとえば磁気テープ／カセットテープなどのテープ系の記録媒体、フレキシブルディスク／ハードディスクなどの磁気ディスクもしくはＣＤ−ＲＯＭ（Compact Disk Read Only Memory）／ＭＯ（
Magneto Optical disk）／ＭＤ（Mini Disc）／ＤＶＤ（Digital Versatile Disk）／ＣＤ−Ｒ（Compact Disk Recordable）／ブルーレイディスクなどの光ディスクのディスク系の記録媒体、ＩＣ（Integrated Circuit）カード（メモリカードを含む）／光カードなどのカード系の記録媒体、またはマスクＲＯＭ／ＥＰＲＯＭ（Erasable Programmable
Read Only Memory）／ＥＥＰＲＯＭ（Electrically Erasable Programmable Read Only
Memory）／フラッシュＲＯＭなどの半導体メモリを含む固定的にプログラムを担持する記録媒体であってもよい。

また、情報処理装置１，１ａ，１ｂを通信ネットワークと接続可能に構成し、通信ネットワークを介して上記プログラムを供給してもよい。この通信ネットワークとしては、特に限定されず、たとえば、インターネット、イントラネット、エキストラネット、ＬＡＮ（Local Area Network）、ＩＳＤＮ（Integrated Services Digital Network）、ＶＡＮ（Value Added Network）、ＣＡＴＶ（Community Antenna Television）通信網、仮想専用網（Virtual Private Network）、電話回線網、移動体通信網、または衛星通信網など通信ネットワークが利用可能である。また、通信ネットワークを構成する伝送媒体としては、特に限定されず、たとえば、ＩＥＥＥ１３９４、ＵＳＢ（Universal Serial Bus）、電力線搬送、ケーブルＴＶ回線、電話線、ＡＤＳＬ（Asymmetric Digital Subscriber
Line）回線等の有線でも、ＩｒＤＡ（Infrared Data Association）あるいはリモートコントロールで用いられる赤外線、Ｂｌｕｅｔｏｏｔｈ（登録商標）、８０２．１１無線、ＨＤＲ（High Data Rate）、携帯電話網、衛星回線、地上波デジタル網などの無線でも利用可能である。なお、本発明は、上記プログラムが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。

このように、メモリ１３は、文字とその文字の特徴を数値化した特徴量とを対応付けて収録する文字認識辞書１４、および少なくとも１つの文字からなる単語を収録する単語辞書２４を記憶する。文字列行切り出し部１５は、文字列である文字列行が記載された原稿の画像から文字列を表す文字列画像を行ごとに切り出す。文字切り出し部１６は、文字列行切り出し部１５によって切り出された文字列画像から各文字を表す文字画像を１文字ずつ切り出す。特徴抽出部１７は、文字切り出し部１６によって切り出された文字画像から各文字画像が表す文字の特徴量を抽出する。マッチング部１８は、特徴抽出部１７によって抽出された特徴量とメモリ１３に記憶される文字認識辞書１４に収録された特徴量とを比較し、文字画像が表す文字ごとに、文字画像が表す文字として認識され得る候補文字を文字認識辞書１４から少なくとも１つ選択する。文字列生成部１９は、マッチング部１８によって選択された文字画像ごとの候補文字を組み合わせて認識結果文字列を生成する。単語列生成部２１は、文字列生成部１９によって生成された認識結果文字列を構成する候補文字と、メモリ１３に記憶される単語辞書２４に収録された単語とを照合し、単語辞書２４に収録された単語と全文字が一致する文字列、または一部の文字のみが一致する単語を抽出し、抽出した単語からなる単語文字列を生成する。置き換え判定部２２，２２ａ，２２ｂは、文字列生成部１９によって生成された認識結果文字列と単語列生成部２１によって生成された単語文字列とを対応する位置にある文字ごとに比較して異なる文字がある場合、異なる文字については、特徴抽出部１７によって抽出された特徴量と、メモリ１３に記憶される文字認識辞書１４に収録された文字の特徴量のうち単語文字列の文字に一致する文字に対応付けて記憶される特徴量とを比較し、比較結果が予め定める比較基準を満たすとき、認識結果文字列中の文字を単語文字列中の対応する文字で置き換えると判定する。そして、置き換え部２３は、置き換え判定部２２，２２ａ，２２ｂによって置き換えると判定された認識結果文字列中の文字を単語文字列中の対応する位置にある文字で置き換える。

したがって、文字認識辞書１４および単語辞書２４以外の辞書を用いることなく、認識した文字の誤りを正しい文字に訂正することができる。文字認識辞書１４および単語辞書２４以外の辞書を必要としないので、記憶容量の増加を回避することができる。

さらに、メモリ１３は、文字とその文字の特徴を数値化した特徴量とを対応付けて収録する文字認識辞書１４、および少なくとも１つの文字からなる単語を収録する単語辞書２４を記憶する。文字列行切り出し部１５は、文字列である文字列行が記載された原稿の画像から文字列を表す文字列画像を行ごとに切り出す。文字切り出し部１６は、文字列行切り出し部１５によって切り出された文字列画像から各文字を表す文字画像を１文字ずつ切り出す。特徴抽出部１７は、文字切り出し部１６によって切り出された文字画像から各文字画像が表す文字の特徴量を抽出する。マッチング部１８は、特徴抽出部１７によって抽出された特徴量とメモリ１３に記憶される文字認識辞書１４に収録された特徴量とを比較し、文字画像が表す文字ごとに、文字画像が表す文字として認識され得る候補文字を文字認識辞書１４から少なくとも１つ選択する。文字列生成部１９は、マッチング部１８によって選択された文字画像ごとの候補文字を組み合わせて認識結果文字列を生成する。単語列生成部２１は、文字列生成部１９によって生成された認識結果文字列を構成する候補文字と、メモリ１３に記憶される単語辞書２４に収録された単語とを照合し、単語辞書２４に収録された単語と全文字が一致する文字列、または一部の文字のみが一致する単語を抽出し、抽出した単語からなる単語文字列を生成する。置き換え判定部２２，２２ａ，２２ｂは、文字列生成部１９によって生成された認識結果文字列と単語列生成部２１によって生成された単語文字列とを対応する位置にある文字ごとに比較して異なる文字がある場合、異なる文字については、メモリ１３に記憶される文字認識辞書１４に収録された特徴量のうち認識結果文字列の文字に一致する文字に対応付けて記憶される特徴量と、メモリ１３に記憶される文字認識辞書１４に収録された文字の特徴量のうち単語文字列の文字に一致する文字に対応付けて記憶される特徴量とを比較し、比較結果が予め定める比較基準を満たすとき、認識結果文字列中の文字を単語文字列中の対応する文字で置き換えると判定する。そして、置き換え部２３は、置き換え判定部２２，２２ａ，２２ｂによって置き換えると判定された認識結果文字列中の文字を単語文字列中の対応する位置にある文字で置き換える。

さらに、置き換え判定部２２，２２ａ，２２ｂは、文字列生成部１９によって生成された認識結果文字列と単語列生成部２１によって生成された単語文字列とを対応する位置にある文字ごとに比較して異なる文字がある場合、異なる文字については、特徴抽出部１７によって抽出された特徴量と、メモリ１３に記憶される文字認識辞書１４に収録された特徴量のうち単語文字列の文字に一致する文字に対応付けて記憶される特徴量とを比較して類似度を算出し、算出した類似度が予め定める閾値以上であるとき、認識結果文字列中の文字を単語文字列中の対応する文字で置き換えると判定する。したがって、特徴量による類似度を指標とするので、簡単な計算で文字の類似を判定することができる。

さらに、置き換え判定部２２，２２ａ，２２ｂは、文字列生成部１９によって生成された認識結果文字列と単語列生成部２１によって生成された単語文字列とを対応する位置にある文字ごとに比較して異なる文字がある場合、異なる文字については、メモリ１３に記憶される文字認識辞書１４に収録された特徴量のうち認識結果文字列の文字に一致する文字に対応付けて記憶される特徴量と、メモリ１３に記憶される文字認識辞書１４に収録された特徴量のうち単語文字列の文字の一致する文字に対応付けて記憶される特徴量とを比較して類似度を算出し、算出した類似度が予め定める閾値以上であるとき、認識結果文字列中の文字を単語文字列中の対応する文字で置き換えると判定する。したがって、特徴量による類似度を指標とするので、簡単な計算で文字の類似を判定することができる。

さらに、置き換え判定部２２，２２ａ，２２ｂは、前記算出した類似度が予め定める閾値未満であるとき、単語列生成部２１が前記単語文字列を生成したときに、単語辞書２４に収録された単語と全文字が一致する文字列、または一部の文字のみが一致する単語であって、前記単語文字列に含まれない単語が抽出されていた場合は、前記算出した類似度が、予め定める閾値未満の値である予め定める第２の閾値以上であるとき、認識結果文字列中の文字を単語文字列中の対応する文字で置き換えると判定する。

したがって、単語の候補が１つしか生成されていない場合は、その単語の候補は、正解である可能性が高く、類似度が予め定める閾値未満であっても、最適な単語として置き換えることができる。たとえば、光学式文字認識では、「かすれ」あるいは「にじみ」が原因で、複数の文字からなる単語のうちの１つの文字が正しく認識されない場合、類似度が低くなり、予め定める閾値未満になることがあるが、単語辞書２４から抽出された単語が１つである場合、正解である可能性は非常に高く、この単語を用いて修正することによって、正しい文字に訂正することができるという効果がある。

さらに、置き換え判定部２２，２２ａ，２２ｂは、前記算出した類似度が予め定める閾値未満であるとき、前記異なる文字を含む単語の文字数が予め定める基準文字数以上である場合は、前記算出した類似度が、予め定める閾値未満の値である予め定める第２の閾値以上であるとき、認識結果文字列中の文字を単語文字列中の対応する文字で置き換えると判定する。したがって、文字数が多い単語については、類似度が予め定める閾値未満であっても、正解である可能性が高く、最適な単語を選択して置き換えることができる。

さらに、文字とその文字の特徴を数値化した特徴量とを対応付けて収録する文字認識辞書１４、および少なくとも１つの文字からなる単語を収録する単語辞書２４を記憶するメモリ１３を含む情報処理装置で、メモリ１３に記憶される文字認識辞書１４および単語辞書２４を用いて文字を認識するにあたって、図１０に示したステップＡ２では、文字列である文字列行が記載された原稿の画像から文字列を表す文字列画像を行ごとに切り出す。図１０に示したステップＡ３では、図１０に示したステップＡ２で切り出された文字列画像から各文字を表す文字画像を１文字ずつ切り出す。図１０に示したステップＡ４では、図１０に示したステップＡ３で切り出された文字画像から各文字画像が表す文字の特徴量を抽出する。図１０に示したステップＡ５では、図１０に示したステップＡ４で抽出された特徴量とメモリ１３に記憶される文字認識辞書１４に収録された特徴量とを比較し、文字画像が表す文字ごとに、文字画像が表す文字として認識され得る候補文字を文字認識辞書１４から少なくとも１つ選択する。図１０に示したステップＡ６では、図１０に示したステップＡ５で選択された文字画像ごとの候補文字を組み合わせて認識結果文字列を生成する。図１１に示したステップＢ１、図１７に示したステップＣ１，Ｃ２、または図２５に示したステップＤ１では、図１０に示したステップＡ６で生成された認識結果文字列を構成する候補文字と、メモリ１３に記憶される単語辞書２４に収録された単語とを照合し、単語辞書２４に収録された単語と全文字が一致する文字列、または一部の文字のみが一致する単語を抽出し、抽出した単語からなる単語文字列を生成する。図１１に示したステップＢ２，Ｂ４〜Ｂ６、図１７に示したステップＣ３，Ｃ５〜Ｃ８、または図２５に示したステップＤ２，Ｄ４〜Ｄ９では、図１０に示したステップＡ６で生成された認識結果文字列と図１１に示したステップＢ１、図１７に示したステップＣ１，Ｃ２、または図２５に示したステップＤ１で生成された単語文字列とを対応する位置にある文字ごとに比較して異なる文字がある場合、異なる文字については、図１０に示したステップＡ４で抽出された特徴量と、メモリ１３に記憶される文字認識辞書１４に収録された文字の特徴量のうち単語文字列の文字に一致する文字に対応付けて記憶される特徴量とを比較し、比較結果が予め定める比較基準を満たすとき、認識結果文字列中の文字を単語文字列中の対応する文字で置き換えると判定する。そして、図１１に示したステップＢ３，Ｂ７、図１７に示したステップＣ４，Ｃ９、または図２５に示したステップＤ３，Ｄ１０では、図１１に示したステップＢ２，Ｂ４〜Ｂ６、図１７に示したステップＣ３，Ｃ５〜Ｃ８、または図２５に示したステップＤ２，Ｄ４〜Ｄ９で置き換えると判定された認識結果文字列中の文字を単語文字列中の対応する位置にある文字で置き換える。

したがって、文字認識辞書１４および単語辞書２４以外の辞書を用いることなく、認識した文字の誤りを正しい文字に訂正することができる。文字認識辞書１４および単語辞書２４以外の辞書を必要としないので、情報処理装置の記憶容量の増加を回避することができる。

さらに、文字とその文字の特徴を数値化した特徴量とを対応付けて収録する文字認識辞書１４、および少なくとも１つの文字からなる単語を収録する単語辞書２４を記憶するメモリ１３を含む情報処理装置で、メモリ１３に記憶される文字認識辞書１４および単語辞書２４を用いて文字を認識するにあたって、図１０に示したステップＡ２では、文字列である文字列行が記載された原稿の画像から文字列を表す文字列画像を行ごとに切り出す。図１０に示したステップＡ３では、図１０に示したステップＡ２で切り出された文字列画像から各文字を表す文字画像を１文字ずつ切り出す。図１０に示したステップＡ４では、図１０に示したステップＡ３で切り出された文字画像から各文字画像が表す文字の特徴量を抽出する。図１０に示したステップＡ５では、図１０に示したステップＡ４で抽出された特徴量とメモリ１３に記憶される文字認識辞書１４に収録された特徴量とを比較し、文字画像が表す文字ごとに、文字画像が表す文字として認識され得る候補文字を文字認識辞書１４から少なくとも１つ選択する。図１０に示したステップＡ６では、図１０に示したステップＡ５で選択された文字画像ごとの候補文字を組み合わせて認識結果文字列を生成する。図１１に示したステップＢ１、図１７に示したステップＣ１，Ｃ２、または図２５に示したステップＤ１では、図１０に示したステップＡ６で生成された認識結果文字列を構成する候補文字と、メモリ１３に記憶される単語辞書２４に収録された単語とを照合し、単語辞書２４に収録された単語と全文字が一致する文字列、または一部の文字のみが一致する単語を抽出し、抽出した単語からなる単語文字列を生成する。図１１に示したステップＢ２，Ｂ４〜Ｂ６、図１７に示したステップＣ３，Ｃ５〜Ｃ８、または図２５に示したステップＤ２，Ｄ４〜Ｄ９では、図１０に示したステップＡ６で生成された認識結果文字列と図１１に示したステップＢ１、図１７に示したステップＣ１，Ｃ２、または図２５に示したステップＤ１で生成された単語文字列とを対応する位置にある文字ごとに比較して異なる文字がある場合、異なる文字については、メモリ１３に記憶される文字認識辞書１４に収録された特徴量のうち認識結果文字列の文字に一致する文字に対応付けて記憶される特徴量と、メモリ１３に記憶される文字認識辞書１４に収録された文字の特徴量のうち単語文字列の文字に一致する文字に対応付けて記憶される特徴量とを比較し、比較結果が予め定める比較基準を満たすとき、認識結果文字列中の文字を単語文字列中の対応する文字で置き換えると判定する。そして、図１１に示したステップＢ３，Ｂ７、図１７に示したステップＣ４，Ｃ９、または図２５に示したステップＤ３，Ｄ１０では、図１１に示したステップＢ２，Ｂ４〜Ｂ６、図１７に示したステップＣ３，Ｃ５〜Ｃ８、または図２５に示したステップＤ２，Ｄ４〜Ｄ９で置き換えると判定された認識結果文字列中の文字を単語文字列中の対応する位置にある文字で置き換える。

さらに、コンピュータに情報処理方法の各工程を実行させるためのプログラムとして提供することができる。

さらに、コンピュータに前記情報処理方法の各工程を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体として提供することができる。

１，１ａ，１ｂ情報処理装置
２入力装置
３出力装置
１１制御部
１２入出力制御部
１３メモリ
１４文字認識辞書
１５文字列行切り出し部
１６文字切り出し部
１７特徴抽出部
１８マッチング部
１９文字列生成部
２０，２０ａ，２０ｂ後処理部
２１単語列生成部
２２，２２ａ，２２ｂ置き換え判定部
２３置き換え部
２４単語辞書
３０文字
３１メッシュ
３２特徴量
３３メッシュ特徴量

Claims

文字とその文字の特徴を数値化した特徴量とを対応付けて収録する文字認識辞書、および少なくとも１つの文字からなる単語を収録する単語辞書を記憶する記憶部と、
文字列である文字列行が記載された原稿の画像から文字列を表す文字列画像を行ごとに切り出す文字列行切り出し部と、
文字列行切り出し部によって切り出された文字列画像から各文字を表す文字画像を１文字ずつ切り出す文字切り出し部と、
文字切り出し部によって切り出された文字画像から各文字画像が表す文字の特徴量を抽出する特徴抽出部と、
特徴抽出部によって抽出された特徴量と記憶部に記憶される文字認識辞書に収録された特徴量とを比較し、文字画像が表す文字ごとに、文字画像が表す文字として認識され得る候補文字を文字認識辞書から少なくとも１つ選択する選択部と、
選択部によって選択された文字画像ごとの候補文字を組み合わせて認識結果文字列を生成する文字列生成部と、
文字列生成部によって生成された認識結果文字列を構成する候補文字と、記憶部に記憶される単語辞書に収録された単語とを照合し、単語辞書に収録された単語と全文字が一致する文字列、または一部の文字のみが一致する単語を抽出し、抽出した単語からなる単語文字列を生成する単語列生成部と、
文字列生成部によって生成された認識結果文字列と単語列生成部によって生成された単語文字列とを対応する位置にある文字ごとに比較して異なる文字がある場合、異なる文字については、特徴抽出部によって抽出された特徴量と、記憶部に記憶される文字認識辞書に収録された文字の特徴量のうち単語文字列の文字に一致する文字に対応付けて記憶される特徴量とを比較し、比較結果に基づいて、認識結果文字列中の文字を単語文字列中の対応する文字で置き換えるか否かを判定する置き換え判定部と、
置き換え判定部によって置き換えると判定された認識結果文字列中の文字を単語文字列中の対応する位置にある文字で置き換える置き換え部とを含むことを特徴とする情報処理装置。
文字とその文字の特徴を数値化した特徴量とを対応付けて収録する文字認識辞書、および少なくとも１つの文字からなる単語を収録する単語辞書を記憶する記憶部と、
文字列である文字列行が記載された原稿の画像から文字列を表す文字列画像を行ごとに切り出す文字列行切り出し部と、
文字列行切り出し部によって切り出された文字列画像から各文字を表す文字画像を１文字ずつ切り出す文字切り出し部と、
文字切り出し部によって切り出された文字画像から各文字画像が表す文字の特徴量を抽出する特徴抽出部と、
特徴抽出部によって抽出された特徴量と記憶部に記憶される文字認識辞書に収録された特徴量とを比較し、文字画像が表す文字ごとに、文字画像が表す文字として認識され得る候補文字を文字認識辞書から少なくとも１つ選択する選択部と、
選択部によって選択された文字画像ごとの候補文字を組み合わせて認識結果文字列を生成する文字列生成部と、
文字列生成部によって生成された認識結果文字列を構成する候補文字と、記憶部に記憶される単語辞書に収録された単語とを照合し、単語辞書に収録された単語と全文字が一致する文字列、または一部の文字のみが一致する単語を抽出し、抽出した単語からなる単語文字列を生成する単語列生成部と、
文字列生成部によって生成された認識結果文字列と単語列生成部によって生成された単語文字列とを対応する位置にある文字ごとに比較して異なる文字がある場合、異なる文字については、記憶部に記憶される文字認識辞書に収録された特徴量のうち認識結果文字列の文字に一致する文字に対応付けて記憶される特徴量と、記憶部に記憶される文字認識辞書に収録された特徴量のうち単語文字列の文字に一致する文字に対応付けて記憶される特徴量とを比較し、比較結果が予め定める比較基準を満たすとき、認識結果文字列中の文字を単語文字列中の対応する文字で置き換えると判定する置き換え判定部と、
置き換え判定部によって置き換えると判定された認識結果文字列中の文字を単語文字列中の対応する文字で置き換える置き換え部とを含むことを特徴とする情報処理装置。
前記置き換え判定部は、前記文字列生成部によって生成された認識結果文字列と前記単語列生成部によって生成された単語文字列とを対応する位置にある文字ごとに比較して異なる文字がある場合、異なる文字については、前記特徴抽出部によって抽出された特徴量と、前記記憶部に記憶される文字認識辞書に収録された特徴量のうち単語文字列の文字に一致する文字に対応付けて記憶される特徴量とを比較して類似度を算出し、算出した類似度が予め定める閾値以上であるとき、認識結果文字列中の文字を単語文字列中の対応する文字で置き換えると判定することを特徴とする請求項１に記載の情報処理装置。
前記置き換え判定部は、前記文字列生成部によって生成された認識結果文字列と前記単語列生成部によって生成された単語文字列とを対応する位置にある文字ごとに比較して異なる文字がある場合、異なる文字については、前記記憶部に記憶される文字認識辞書に収録された特徴量のうち認識結果文字列の文字に一致する文字に対応付けて記憶される特徴量と、前記記憶部に記憶される文字認識辞書に収録された特徴量のうち単語文字列の文字の一致する文字に対応付けて記憶される特徴量とを比較して類似度を算出し、算出した類似度が予め定める閾値以上であるとき、認識結果文字列中の文字を単語文字列中の対応する文字で置き換えると判定することを特徴とする請求項２に記載の情報処理装置。
前記置き換え判定部は、前記算出した類似度が予め定める閾値未満であるとき、前記単語列生成部が前記単語文字列を生成したときに、前記単語辞書に収録された単語と全文字が一致する文字列、または一部の文字のみが一致する単語であって、前記単語文字列に含まれない単語が抽出されていた場合は、前記算出した類似度が、予め定める閾値未満の値である予め定める第２の閾値以上であるとき、認識結果文字列中の文字を単語文字列中の対応する文字で置き換えると判定することを特徴とする請求項３または４に記載の情報処理装置。
前記置き換え判定部は、前記算出した類似度が予め定める閾値未満であるとき、前記異なる文字を含む単語の文字数が予め定める基準文字数以上である場合は、前記算出した類似度が、予め定める閾値未満の値である予め定める第２の閾値以上であるとき、認識結果文字列中の文字を単語文字列中の対応する文字で置き換えると判定することを特徴とする請求項３または４に記載の情報処理装置。
文字とその文字の特徴を数値化した特徴量とを対応付けて収録する文字認識辞書、および少なくとも１つの文字からなる単語を収録する単語辞書を記憶する記憶部を含む情報処理装置で、記憶部に記憶される文字認識辞書および単語辞書を用いて文字を認識する情報処理方法であって、
文字列である文字列行が記載された原稿の画像から文字列を表す文字列画像を行ごとに切り出す文字列行切り出し工程と、
文字列行切り出し工程で切り出された文字列画像から各文字を表す文字画像を１文字ずつ切り出す文字切り出し工程と、
文字切り出し工程で切り出された文字画像から各文字画像が表す文字の特徴量を抽出する特徴抽出工程と、
特徴抽出工程で抽出された特徴量と記憶部に記憶される文字認識辞書に収録された特徴量とを比較し、文字画像が表す文字ごとに、文字画像が表す文字として認識され得る候補文字を文字認識辞書から少なくとも１つ選択する選択工程と、
選択工程で選択された文字画像ごとの候補文字を組み合わせて認識結果文字列を生成する文字列生成工程と、
文字列生成工程で生成された認識結果文字列を構成する候補文字と、記憶部に記憶される単語辞書に収録された単語とを照合し、単語辞書に収録された単語と全文字が一致する文字列、または一部の文字のみが一致する単語を抽出し、抽出した単語からなる単語文字列を生成する単語列生成工程と、
文字列生成工程で生成された認識結果文字列と単語列生成工程で生成された単語文字列とを対応する位置にある文字ごとに比較して異なる文字がある場合、異なる文字については、特徴抽出工程で抽出された特徴量と、記憶部に記憶される文字認識辞書に収録された文字の特徴量のうち単語文字列の文字に一致する文字に対応付けて記憶される特徴量とを比較し、比較結果が予め定める比較基準を満たすとき、認識結果文字列中の文字を単語文字列中の対応する文字で置き換えると判定する置き換え判定工程と、
置き換え判定工程で置き換えると判定された認識結果文字列中の文字を単語文字列中の対応する位置にある文字で置き換える置き換え工程とを含むことを特徴とする情報処理方法。
文字とその文字の特徴を数値化した特徴量とを対応付けて収録する文字認識辞書、および少なくとも１つの文字からなる単語を収録する単語辞書を記憶する記憶部を含む情報処理装置で、記憶部に記憶される文字認識辞書および単語辞書を用いて文字を認識する情報処理方法であって、
文字列である文字列行が記載された原稿の画像から文字列を表す文字列画像を行ごとに切り出す文字列行切り出し工程と、
文字列行切り出し工程で切り出された文字列画像から各文字を表す文字画像を１文字ずつ切り出す文字切り出し工程と、
文字切り出し工程で切り出された文字画像から各文字画像が表す文字の特徴量を抽出する特徴抽出工程と、
特徴抽出工程で抽出された特徴量と記憶部に記憶される文字認識辞書に収録された特徴量とを比較し、文字画像が表す文字ごとに、文字画像が表す文字として認識され得る候補文字を文字認識辞書から少なくとも１つ選択する選択工程と、
選択工程で選択された文字画像ごとの候補文字を組み合わせて認識結果文字列を生成する文字列生成工程と、
文字列生成工程で生成された認識結果文字列を構成する候補文字と、記憶部に記憶される単語辞書に収録された単語とを照合し、単語辞書に収録された単語と全文字が一致する文字列、または一部の文字のみが一致する単語を抽出し、抽出した単語からなる単語文字列を生成する単語列生成工程と、
文字列生成工程で生成された認識結果文字列と単語列生成工程で生成された単語文字列とを対応する位置にある文字ごとに比較して異なる文字がある場合、異なる文字については、記憶部に記憶される文字認識辞書に収録された特徴量のうち認識結果文字列の文字に一致する文字に対応付けて記憶される特徴量と、記憶部に記憶される文字認識辞書に収録された文字の特徴量のうち単語文字列の文字に一致する文字に対応付けて記憶される特徴量とを比較し、比較結果が予め定める比較基準を満たすとき、認識結果文字列中の文字を単語文字列中の対応する文字で置き換えると判定する置き換え判定工程と、
置き換え判定工程で置き換えると判定された認識結果文字列中の文字を単語文字列中の対応する位置にある文字で置き換える置き換え工程とを含むことを特徴とする情報処理方法。
文字とその文字の特徴を数値化した特徴量とを対応付けて収録する文字認識辞書、および少なくとも１つの文字からなる単語を収録する単語辞書を記憶する記憶部を含むコンピュータに、
文字列である文字列行が記載された原稿の画像から文字列を表す文字列画像を行ごとに切り出す文字列行切り出し工程と、
文字列行切り出し工程で切り出された文字列画像から各文字を表す文字画像を１文字ずつ切り出す文字切り出し工程と、
文字切り出し工程で切り出された文字画像から各文字画像が表す文字の特徴量を抽出する特徴抽出工程と、
特徴抽出工程で抽出された特徴量と記憶部に記憶される文字認識辞書に収録された特徴量とを比較し、文字画像が表す文字ごとに、文字画像が表す文字として認識され得る候補文字を文字認識辞書から少なくとも１つ選択する選択工程と、
選択工程で選択された文字画像ごとの候補文字を組み合わせて認識結果文字列を生成する文字列生成工程と、
文字列生成工程で生成された認識結果文字列を構成する候補文字と、記憶部に記憶される単語辞書に収録された単語とを照合し、単語辞書に収録された単語と全文字が一致する文字列、または一部の文字のみが一致する単語を抽出し、抽出した単語からなる単語文字列を生成する単語列生成工程と、
文字列生成工程で生成された認識結果文字列と単語列生成工程で生成された単語文字列とを対応する位置にある文字ごとに比較して異なる文字がある場合、異なる文字については、特徴抽出工程で抽出された特徴量と、記憶部に記憶される文字認識辞書に収録された文字の特徴量のうち単語文字列の文字に一致する文字に対応付けて記憶される特徴量とを比較し、比較結果が予め定める比較基準を満たすとき、認識結果文字列中の文字を単語文字列中の対応する文字で置き換えるとを判定する置き換え判定工程と、
置き換え判定工程で置き換えると判定された認識結果文字列中の文字を単語文字列中の対応する位置にある文字で置き換える置き換え工程とを実行させるためのプログラム。
文字とその文字の特徴を数値化した特徴量とを対応付けて収録する文字認識辞書、および少なくとも１つの文字からなる単語を収録する単語辞書を記憶する記憶部を含むコンピュータに、
文字列である文字列行が記載された原稿の画像から文字列を表す文字列画像を行ごとに切り出す文字列行切り出し工程と、
文字列行切り出し工程で切り出された文字列画像から各文字を表す文字画像を１文字ずつ切り出す文字切り出し工程と、
文字切り出し工程で切り出された文字画像から各文字画像が表す文字の特徴量を抽出する特徴抽出工程と、
特徴抽出工程で抽出された特徴量と記憶部に記憶される文字認識辞書に収録された特徴量とを比較し、文字画像が表す文字ごとに、文字画像が表す文字として認識され得る候補文字を文字認識辞書から少なくとも１つ選択する選択工程と、
選択工程で選択された文字画像ごとの候補文字を組み合わせて認識結果文字列を生成する文字列生成工程と、
文字列生成工程で生成された認識結果文字列を構成する候補文字と、記憶部に記憶される単語辞書に収録された単語とを照合し、単語辞書に収録された単語と全文字が一致する文字列、または一部の文字のみが一致する単語を抽出し、抽出した単語からなる単語文字列を生成する単語列生成工程と、
文字列生成工程で生成された認識結果文字列と単語列生成工程で生成された単語文字列とを対応する位置にある文字ごとに比較して異なる文字がある場合、異なる文字については、記憶部に記憶される文字認識辞書に収録された特徴量のうち認識結果文字列の文字に一致する文字に対応付けて記憶される特徴量と、記憶部に記憶される文字認識辞書に収録された文字の特徴量のうち単語文字列の文字に一致する文字に対応付けて記憶される特徴量とを比較し、比較結果が予め定める比較基準を満たすとき、認識結果文字列中の文字を単語文字列中の対応する文字で置き換えるとを判定する置き換え判定工程と、
置き換え判定工程で置き換えると判定された認識結果文字列中の文字を単語文字列中の対応する位置にある文字で置き換える置き換え工程とを実行させるためのプログラム。
請求項９または１０に記載のプログラムを記録したコンピュータ読取り可能な記録媒体。