JP6791593B2

JP6791593B2 - 認識装置、認識プログラム、及び認識方法

Info

Publication number: JP6791593B2
Application number: JP2017169382A
Authority: JP
Inventors: 浩一金元
Original assignee: Fujitsu Frontech Ltd
Current assignee: Fujitsu Frontech Ltd
Priority date: 2017-09-04
Filing date: 2017-09-04
Publication date: 2020-11-25
Anticipated expiration: 2037-09-04
Also published as: JP2019046225A

Description

本発明は、認識装置、認識プログラム、及び認識方法に関する。

従来から、帳票、伝票、各種証書等の書類に記載された文字を認識するための技術として、ＯＣＲ（ＯｐｔｉｃａｌＣｈａｒａｃｔｅｒＲｅｃｏｇｎｉｔｉｏｎ、光学的文字認識）が知られる。ＯＣＲを用いた文字認識においては、書類のレイアウト、認識したい文字が記載されている位置、文字数、カテゴリ(数字、手書き、活字、印字フォント)等は、予め認識装置に記憶される場合がある。

一方、書類の種類が多く、その全ての種類について認識装置が記載面のレイアウト等を把握しきれない場合もある。このとき、認識装置は、「金額」や「納期限」等、認識対象項目の見出し文字等を利用し、これにより項目の位置を特定し、その項目内の認識対象とする文字を探し出し認識を行う場合もある（例えば、特許文献１を参照。）。

特開２０１０―００３１５５号公報

従来の認識装置は、記入枠、プレプリント文字、背景色、及び認識対象文字を識別して文字認識を行う。しかしながら、カラフルな背景デザインの有る本人確認証等は、背景デザインが文字認識には不要となり得、従来の認識装置では、文字を正しく抽出できず、文字認識を失敗する場合がある。

本発明の１つの側面に係わる目的は、書類の背景デザインに影響されることなく、書類に記載された文字を正しく抽出することである。

認識装置は、色除去部と均一化部と補正部とを備える。色除去部は、取得した画像データにおける画素の輝度値が第１の閾値以上で、画素の彩度値が第２の閾値以上の場合に、画素の彩度値を、第２の閾値未満である第１の彩度値とする。均一化部は、画素の輝度値が第３の閾値以上の場合に、画素を背景画素に置き換える。補正部は、画像データにおける画素のうち、背景画素と情報伝達用画素の間に位置する画素と、情報伝達用画素のそれぞれの輝度の差の絶対値が第４の閾値以上の場合に、背景画素と情報伝達用画素との間に位置する画素を、背景画素へと置き換える。

本発明によれば、書類の背景デザインに影響されることなく、書類に記載された文字を正しく抽出できる。

第１、２の実施形態に係る各認識装置の機能ブロックを例示する図である。背景処理部による処理の流れを示す図である。色除去部による処理のフローチャートである。均一化部による処理のフローチャートである。補正部による処理の概略を例示する図である。補正部による、情報伝達用画素付近の画素の判定方法の概略を例示する図である。注目画素を分類するための、判定のパターンを例示する図である。注目画素の座標と隣接画素の座標を示す図である。補正部による処理のフローチャートである。認識装置のハードウェア構成を例示する図である。従来の文字認識の方法を用いた場合の出力結果を例示する図である。第１、２の実施形態に係る認識方法を用いた場合の、画像データの背景部分の出力結果を例示する図である。色除去部による処理及び均一化部による処理の前後における各画像を例示する図である。第２の実施形態における均一化部による輝度ヒストグラムの生成処理のフローチャートである。第２の実施形態における均一化部により生成される輝度ヒストグラムをグラフとして表現したものの一例を示す図である。第２の実施形態における均一化部による背景の均一化処理のフローチャートである。

（第１の実施形態）
図１は、第１の実施形態に係る認識装置１、第２の実施形態に係る認識装置１´の機能ブロックを例示する。

図１において、第１の実施形態に係る認識装置１は、画像入力部１０、背景処理部１１、文字解析・位置特定部１２、認識結果出力部１３、及び制御部１４等を備える。画像入力部１０、背景処理部１１、文字解析・位置特定部１２、及び認識結果出力部１３は、制御部１４に接続されている。なお、これ以外の接続関係があってもよい。

背景処理部１１は、色除去部１１０、均一化部１１１、及び補正部１１２等を備える。色除去部１１０は均一化部１１１と接続され、均一化部１１１は補正部１１２と接続されている。なお、接続関係はこれらに限らない。

画像入力部１０は、スキャナ等の画像入力装置によって読み取った画像データの入力を受け付け、これを制御部１４へ出力する。なお、本実施形態における画像入力部１０から入力される画像データは、ＲＧＢ表色系のデータであるとする。

背景処理部１１の色除去部１１０は、制御部１４からの指示に基づき、入力された画像データにおける画素の色の除去を行う。この処理のために、色除去部１１０は、画像データの各画素の輝度の値（輝度値）を算出し、また当該画像データのＲＧＢ表色系からＨＳＶ表色系への変換を行う。

ここで輝度Ｙは、以下の数１式を用いて表される。なお、輝度は、例えば、０から２５５までの値を取り得、輝度値は、以下の実施形態において整数であるとして説明を行う。ただし、輝度値は、整数に限定されない。

ここでＲ、Ｇ、Ｂは、それぞれ赤色光、緑色光、青色光の階調を示し、それぞれの値（階調値）は０以上２５５以下の整数である。なお、赤色光、緑色光、青色光は、それぞれ約７００ｎｍ、約５４６．１ｎｍ、約４３５．８ｎｍの波長の光である。数１式に示す輝度値の算出のための式や、以下のＨＳＶ表色系への変換式は公知であるが、以下の説明において理解容易のためにここに記載する。
入力された画像データのＨＳＶ表色系への変換式は以下のようになる。

ここでＳ、Ｖは、それぞれ彩度、明度を表し、例えば、０から１までの値を取り得る。またＨは、色相を表し、例えば、０から３６０までの値を取り得る。ＭＡＸ（Ｒ，Ｇ，Ｂ）は、Ｒ、Ｇ、Ｂの各階調値のうちの、最大の階調値を意味する。

数３式は、ＭＡＸ（Ｒ，Ｇ，Ｂ）＝０の場合にはＳ＝０とする。数４式、数５式、数６式は、それぞれＭＡＸ（Ｒ，Ｇ，Ｂ）＝Ｒの場合の色相、ＭＡＸ（Ｒ，Ｇ，Ｂ）＝Ｇの場合の色相、ＭＡＸ（Ｒ，Ｇ，Ｂ）＝Ｂの場合の色相を表す。ただしこれらにおいてＨがマイナスの値となった場合には、この値に３６０を加算したものをＨと置き直す。

また色除去部１１０は、ＨＳＶ表色系の画像データのＲＧＢ表色系への変換も行う。なお、この変換処理は公知であることより、説明を省略する。

色除去部１１０は、輝度値が第１の閾値以上で、彩度の値（彩度値）が第２の閾値以上の画素の彩度値を、例えば０、又は０に近い値に変換する。ここで第１の閾値は、例えば１３０であり、第２の閾値は、例えば０．１０である。また変換後の彩度値は、例えば０、又は０．１などの第２の閾値より小さい値であるとする。この変換により、輝度値が第１の閾値以上、且つ彩度値が第２の閾値以上の画素は、無色又は無色に近い色になる。

また色除去部１１０は、当該画素の彩度値を０（又は０に近い値）にしたまま、その明度を上げる。色除去部１１０は、当該画素の元の明度の値（明度値）に対し、例えば０．１５を加算させたものを、当該画素の新たな明度値とする。一般的に彩度値が０（又は０に近い値）となる色は、白色、灰色、黒色であり、黒色は明度（輝度）が０（又は０に近い値）、白色は明度と輝度が最大値（又は最大値に近い値）であることから、ここでは色除去部１１０は、画素を白（又は白に近い色）へと変換している。なお以下では、白色を彩度が０で輝度が２５５の色とし、黒色を彩度が０で輝度が０の色であるとする。ただしこれに限定されない。

第１の閾値以上の輝度値の画素は、例えば黒色等の文字で表される情報伝達のための画素（情報伝達用画素とも記載する）である場合が少ないと考えられ、代わりに背景を構成するための画素として用いられる場合が多いと考えられる。一方、輝度値が第１の閾値以上であっても、彩度値が第２の閾値以上の画素は、背景用の画素であるとしても、色彩を伴うため、情報伝達用画素と区別できなくなる可能性がある。

これらのことから、色除去部１１０は、情報伝達用画素を認識装置１が正確に認識するために、背景用の画素の色を、情報伝達用画素に一般的に用いられる黒又はこれに近い色から区別しやすい、例えば白などの色へと変換させる。なお、情報伝達用画素は、黒色又は黒色に近い濃い色であるとし、例えば輝度値が８０以下の画素を情報伝達用画素とする。

均一化部１１１は、色除去部１１０による上記処理に続き、画像データにおける画素のうち輝度値が第３の閾値以上の画素を、背景用の画素として、（Ｒ、Ｇ、Ｂ）＝（２５５、２５５、２５５）の白色の画素へと置き換える。ここで第３の閾値は、例えば２３０である。なお、均一化部１１１は、輝度値が第３の閾値以上の画素を、（Ｒ、Ｇ、Ｂ）≒（２５５、２５５、２５５）の白色に近い画素に置き換えてもよい。なお、「≒」は、ほぼ等しいことを示す。

補正部１１２は、均一化部１１１による上記処理に続き、情報伝達用画素の周囲に発生するノイズの除去処理を行う。この処理について詳細に説明する。読み取られた画像データにおいて、情報伝達用画素の近傍の画素であって本来背景を表すはずの画素が、情報伝達用画素と区別できない場合がある。すなわち、本来背景を表すはずの、情報伝達用画素の近傍の画素の輝度値が、例えば８０以下であるなど、情報伝達用画素の輝度値に近く、当該画素がノイズとなってしまう場合がある。これを防いで認識装置１が情報伝達用画素から正確に文字情報を得るために、補正部１１２は情報伝達用画素付近の画素の輝度等に対し補正を行う。

背景処理部１１は、制御部１４からの指示に応じて、色除去部１１０と均一化部１１１と補正部１１２による処理後の画像データを制御部１４へ出力する。

文字解析・位置特定部１２は、制御部１４から、背景処理部１１による背景に係る画素のデータが補正された画像データを取得し、当該画像データにおける情報伝達用画素を用いて、当該画素が形成する文字が何の文字なのか解析したり、文字列の位置を特定したりし、必要な情報の認識を行う。これらの処理は、既存のものであることから、ここでは説明を省略する。文字解析・位置特定部１２は、処理結果を制御部１４へ出力する。

認識結果出力部１３は、制御部１４からの指示等を受け、文字解析・位置特定部１２により認識された文字（認識済み文字とも記載する）を、例えば画面上へ表示するための処理や、他の認証装置等に認識済み文字に係るデータを出力する処理等を行う。

制御部１４は、画像入力部１０、背景処理部１１、文字解析・位置特定部１２、及び認識結果出力部１３との間で必要な情報の授受を行うとともに、これらの機能ブロックに対し適宜指示を出力する。

図２は、背景処理部１１による処理の流れを示す図である。
画像データを取得した背景処理部１１では、まず色除去部１１０による処理が実行される（ステップＳ２００）。色除去部１１０により、背景の画素の色を無色へと変換された画像データは、均一化部１１１へ出力される。ここで無色とは、彩度が０又はこれに近い値の色であるとする。均一化部１１１は、画像データにおいて、輝度が第３の閾値以上の画素を白色画素へと変換する（ステップＳ２０１）。均一化部１１１により、背景の画素を均一に白色画素に置き換えられた画像データは、補正部１１２へ出力される。続いて補正部１１２による処理が行われ（ステップＳ２０２）、この処理結果が制御部１４へと出力される。

図３は、ステップＳ２００の色除去部１１０による処理を、より詳細に示したフローチャートである。

色除去部１１０は、取得した画像データにおける或る画素のＲ、Ｇ、Ｂの各値（以下、Ｒ、Ｇ、Ｂの各階調値とも記載し、これらをまとめたものをＲＧＢ階調値とも記載する）から輝度を算出する（ステップＳ３００）。また色除去部１１０は、当該画素のＲＧＢ階調値から、Ｈ、Ｓ、Ｖを算出する（ステップＳ３０１）。この算出は、ＲＧＢ表色系における値からＨＳＶ表色系における値への変換に相当する。なお、色除去部１１０は、ステップＳ３００とステップＳ３０１の各処理を、順序を逆にして実行しても、並行して実行してもよい。

色除去部１１０は、画素の輝度値が第１の閾値以上であるか否か判定する（ステップＳ３０２）。

画素の輝度値が第１の閾値以上である場合（ステップＳ３０２：Ｙｅｓ）、色除去部１１０は、当該画素の彩度値が第２の閾値以上であるが判定する（ステップＳ３０３）。画素の輝度値が第１の閾値より小さい場合（ステップＳ３０２：Ｎｏ）、色除去部１１０は、少なくともステップＳ３００からステップＳ３０２までの処理を未だに実行していない他の画素についてステップＳ３００以降の処理を実行する。画素の輝度値が第１の閾値より小さい場合（ステップＳ３０２：Ｎｏ）であって、全ての画素について少なくともステップＳ３００からステップＳ３０２の処理が済んでいる場合には、色除去部１１０による処理は終了する。

色除去部１１０は、画素の彩度値が第２の閾値以上であるか否か判定する（ステップＳ３０３）。

画素の彩度値が第２の閾値以上であれば（ステップＳ３０３：Ｙｅｓ）、色除去部１１０は、当該画素の彩度値を０又は０に近い値へ置き換える（ステップＳ３０４）。画素の彩度値が第２の閾値より小さい場合には（ステップＳ３０３：Ｎｏ）、色除去部１１０は、少なくともステップＳ３００からステップＳ３０２の処理を未だに実行していない他の画素についてステップＳ３００以降の処理を実行する。画素の彩度値が第２の閾値より小さい場合（ステップＳ３０３：Ｎｏ）であって、全ての画素について少なくともステップＳ３００からステップＳ３０２の処理が済んでいる場合には、色除去部１１０による処理は終了する。

ステップＳ３０４に続き、色除去部１１０は、当該画素の明度を上昇させ、元の明度値より大きい値を当該画素の新たな明度値とする（ステップＳ３０５）。色除去部１１０は、例えば、元の明度値に対し、０．１５を加算した値を新たな明度値とする。なお、色除去部１１０は、ステップＳ３０５の処理を、ステップＳ３０４の処理の前に行ってもよく、又はステップＳ３０４の処理と並行して行ってもよい。

色除去部１１０は、ステップＳ３０４とステップＳ３０５の各々の処理において変換した彩度値と明度値に基づき、画素のＲ、Ｇ、Ｂの各階調値を算出する（ステップＳ３０６）。この処理はＨＳＶ表色系における値から、ＲＧＢ表色系における値への変換に相当する。

色除去部１１０は、元の画像データにおける画素のＲ、Ｇ、Ｂの各階調値を、ステップＳ３０６で算出した当該画素のＲ、Ｇ、Ｂの各階調値へと置き換える（ステップＳ３０７）。

色除去部１１０は、ステップＳ３００からステップＳ３０７（又はステップＳ３０２若しくはステップＳ３０３）までの処理を、画像データの全ての画素に対して行う。画像データの全ての画素に対し、ステップＳ３００からステップＳ３０７（又はステップＳ３０２若しくはステップＳ３０３）までの処理を実行した色除去部１１０は、処理結果を均一化部１１１へ出力する。これにより背景処理部１１による処理は、図２においてステップＳ２００からステップＳ２０１へ移行する。

図４は、ステップＳ２０１の均一化部１１１による処理を、より詳細に示したフローチャートである。

均一化部１１１は、色除去部１１０により背景の色が除去された画像データにおける任意の１つの画素のＲＧＢ階調値から、当該画素の輝度値を算出する（ステップＳ４００）。均一化部１１１は、ステップＳ４００において算出した輝度値が第３の閾値以上であるか否かを判定する（ステップＳ４０１）。この第３の閾値は、例えば２３０である。

輝度値が第３の閾値以上である場合（ステップＳ４０１：Ｙｅｓ）、均一化部１１１は、当該画素を背景画素に置き換える（ステップＳ４０２）。

ここで背景画素とは、背景を表すための画素として、Ｒ、Ｇ、Ｂの各階調値を置き換えた画素を意味するものとする。本実施形態においては、背景画素のＲ、Ｇ、Ｂの階調値は、全て２５５であるとする。すなわち本実施形態における背景画素は白色画素であるとする。ただし、これに限定されず、彩度が例えば０．１より小さく、輝度が例えば２３０以上の画素を背景画素としてもよい。

輝度値が第３の閾値より小さい場合（ステップＳ４０１：Ｎｏ）、均一化部１１１は、少なくともステップＳ４００とステップＳ４０１の処理が未だ行われていない画素について、ステップＳ４００以降の処理を行う。輝度値が第３の閾値より小さい場合（ステップＳ４０１：Ｎｏ）であって、全ての画素について少なくともステップＳ４００とステップＳ４０１の処理が済んでいる場合には、均一化部１１１による処理は終了する。

均一化部１１１は、全ての画素についてステップＳ４００からステップＳ４０２（又はステップＳ４０１）の処理を行った画像データを補正部１１２へ出力する。

図５は、補正部１１２による処理の概略を例示する。
図５の左側には、色除去部１１０による処理と均一化部１１１による処理の後の画像データが示される。ここからわかるように、情報伝達用画素と背景画素との間の画素は、背景画素であるべき画素であっても、当該画素の輝度値が上記第３の閾値より小さい場合があるため、均一化部１１１により背景画素として置き換えがされていない場合がある。これにより情報伝達用画素は、その近傍の、背景画素として置き換えられていない、背景画素であるべき画素に紛れてしまうことがある。そしてこれにより、情報伝達用の文字の付近にノイズが発生し、文字の認識が正確に行われなくなる場合がある。補正部１１２は、情報伝達用画素の近傍の画素に注目し、この画素とその周辺の画素の各輝度値を用いて、当該画素が背景画素であるべきと判定した場合に、当該画素を背景画素へ置き換える。図５の右側には、補正部１１２による処理後の画像データが示される。図５の左側に示された情報伝達用画素近傍の、輝度値が第３の閾値より小さい、背景画素となるべき画素が、図５の右側においては背景画素へと置き換えられている。

図６は、補正部１１２による、情報伝達用画素付近の画素の判定方法の概略を例示する。

図６の左側には、画像データにおける情報伝達用画素とその近傍が示される。ここでは、補正部１１２が、四角ａに囲まれた画素に注目する場合を考える。すなわち補正部１１２は、四角ａに囲まれた画素を背景画素か情報伝達用画素かに分類する場合を考える。この四角ａで囲まれた画素のように、補正部１１２が背景画素に分類すべきかどうかについて注目する画素を注目画素とも記載する。補正部１１２は、注目画素の分類に際し、その注目画素に隣接する、四角ｂに囲まれた画素の各輝度値を用いる。

図６の右側に示される四角内には、左側において四角ｂ内に示されている各画素に対応する小さな四角（小四角と記載する）が示されており、これらの小四角には、（１）から（９）までの番号が付されている。この小四角の配置は、四角ｂに囲まれた画素の配置と対応する。すなわち四角ｂにおいて左上の画素は、（１）の小四角により表され、四角ａに囲まれた画素は、（５）の小四角により表される。

（１）、（４）、（７）の各小四角に対応する画素は、図６の左側に示されるように背景画素である。なおここでは、理解容易のために、各画素の彩度値が０である場合について説明する。（２）、（５）、（８）の各小四角に対応する画素は、図６の左側に示されるように、薄い灰色の画素である。さらにまた（３）、（６）、（９）の各小四角に対応する画素は、図６の左側に示されるように、濃い灰色の画素である。

図７は、注目画素を分類するための、判定のパターンを例示する。
図７における（Ａ）は、情報伝達用画素と背景画素が、これらの境界を挟んで、それぞれ右と左に位置する場合を示す。（Ｂ）は、情報伝達用画素と背景画素が、これらの境界を挟んで、それぞれ上と下に位置する場合を示す。（Ｃ）は、情報伝達用画素と背景画素が、これらの境界を挟んで、それぞれ左と右に位置する場合を示す。（Ｄ）は、情報伝達用画素と背景画素が、これらの境界を挟んで、それぞれ下と上に位置する場合を示す。

補正部１１２は、この（Ａ）から（Ｄ）の４つのパターンのうちの任意の１以上のパターンを用いて、注目画素に隣接する画素（隣接画素とも記載する）の濃淡（輝度値の大小）に応じて、境界における注目画素を情報伝達用画素と背景画素のいずれかへ分類する。

補正部１１２による補正処理に先立ち、画像データにおける各画素には、次のような座標が割り当てられる。この割り当ては、補正部１１２により行われてもよいし、色除去部１１０や均一化部１１１や制御部１４等により予め行われていてもよい。ここでは補正部１１２により当該割り当てが行われるとする。補正部１１２は、画像データに係る画像において横方向をＸ方向とし、縦方向をＹ方向とし、当該画像の左上端の座標を（０，０）、右上端の座標を（Ｍ−１，０）、左下端の座標を（０，Ｎ−１）、右下端の座標を（Ｍ−１，Ｎ−１）とする。なおＭは、画像の横サイズの大きさを表し、Ｘ方向における画素の総数に相当する。またＮは、画像の縦サイズの大きさを表し、Ｙ方向における画素の総数に相当する。補正部１１２は、注目画素のＸ方向の座標を変数Ｘに格納し、Ｙ方向の座標を変数Ｙに格納する。すなわち補正部１１２は、注目画素の座標を（Ｘ，Ｙ）に格納する。
また補正部１１２は、注目画素の隣接画素の各々の座標を以下のように置く。

図８は、注目画素の座標と、注目画素の座標を（Ｘ，Ｙ）としたときの、隣接画素の座標を示す。

図８において、図６、７における（１）の小四角に対応する画素、（２）の小四角に対応する画素、（３）の小四角に対応する画素の各座標を、（Ｘ−１，Ｙ−１）、（Ｘ，Ｙ−１）、（Ｘ＋１，Ｙ−１）とする。また図８において、（４）の小四角に対応する画素、（６）の小四角に対応する画素の各座標を、（Ｘ−１，Ｙ）、（Ｘ＋１，Ｙ）とする。また図８において、（７）の小四角に対応する画素、（８）の小四角に対応する画素、（９）の小四角に対応する画素の各座標を、（Ｘ−１，Ｙ＋１）、（Ｘ，Ｙ＋１）、（Ｘ＋１，Ｙ＋１）とする。なお、図８において、注目画素の座標（Ｘ，Ｙ）は、図６、７における（５）の小四角に対応する画素である。

図９は、図２におけるステップＳ２０２の、補正部１１２による処理のフローチャートである。

ここでは、理解を容易にするため、補正部１１２は、図７に例示したパターン（Ａ）を例に用いて補正処理を行う場合について説明する。但し、補正部１１２は、他のパターンを用いてもよいし、（Ａ）から（Ｄ）のうちの１以上のパターンを用いた補正処理に続き、他のパターンを用いた補正処理を行ってもよい。

補正部１１２は、最初に、（Ｘ，Ｙ）＝（１，１）の注目画素について、ステップＳ５００からＳ５０６（又はステップＳ５０１、ステップＳ５０２、ステップＳ５０３、ステップＳ５０４、若しくはステップＳ５０５）までの処理を行う。

補正部１１２は、（Ｘ，Ｙ）＝（ｍ，ｎ）である注目画素に対し、以下のステップＳ５００からステップＳ５０６（又はステップＳ５０１、ステップＳ５０２、ステップＳ５０３、ステップＳ５０４、若しくはステップＳ５０５）までの処理を行い、次に（Ｘ，Ｙ）＝（ｍ＋１，ｎ）の注目画素について、ステップＳ５００からステップＳ５０６（又はステップＳ５０１、ステップＳ５０２、ステップＳ５０３、ステップＳ５０４、若しくはステップＳ５０５）までの処理を行う。なおｍとｎは、それぞれ、１以上でＭ−２以下の整数、１以上でＮ−２以下の整数である。

補正部１１２は、（Ｘ，Ｙ）＝（Ｍ−２，ｎ）の注目画素について、ステップＳ５００からステップＳ５０６（又はステップＳ５０１、ステップＳ５０２、ステップＳ５０３、ステップＳ５０４、若しくはステップＳ５０５）までの処理を実行すると、次に（Ｘ，Ｙ）＝（１，ｎ＋１）の注目画素について、ステップＳ５００からステップＳ５０６（又はステップＳ５０１、ステップＳ５０２、ステップＳ５０３、ステップＳ５０４、若しくはステップＳ５０５）までの処理を行う。補正部１１２は、同様に、（Ｘ，Ｙ）＝（ｍ，ｎ＋１）である注目画素に対し、ステップＳ５００からステップＳ５０６（又はステップＳ５０１、ステップＳ５０２、ステップＳ５０３、ステップＳ５０４、若しくはステップＳ５０５）までの処理を行った後、（Ｘ，Ｙ）＝（ｍ＋１，ｎ＋１）の注目画素について、ステップＳ５００からステップＳ５０６（又はステップＳ５０１、ステップＳ５０２、ステップＳ５０３、ステップＳ５０４、若しくはステップＳ５０５）までの処理を行う。そして補正部１１２は、（Ｘ，Ｙ）＝（Ｍ−２，Ｎ−２）の注目画素について、ステップＳ５００からステップＳ５０６（又はステップＳ５０１、ステップＳ５０２、ステップＳ５０３、ステップＳ５０４、若しくはステップＳ５０５）までの処理を行った後、補正処理を終了する。

ステップＳ５００において、補正部１１２は、図８を参照して上述した（１）から（９）の小四角に対応する画素の輝度値を、ＲＧＢ階調値から算出する（ステップＳ５００）。

補正部１１２は、図６における（５）の注目画素が、背景画素（本実施形態では白色画素）、又は背景画素の輝度値と近い輝度値の画素であるか否かを判定する（ステップＳ５０１）。なお、ここではステップＳ５０１の判定条件として、注目画素の輝度値が、図４でのステップＳ４０１における第３の閾値として例示した２３０以上であるか否かとしているが、これに限定されない。

補正部１１２は、（５）の注目画素の輝度値が２３０以上であれば（ステップＳ５０１：Ｙｅｓ）、当該画素を背景用の画素とみなし、当該注目画素には処理を行わない。そして補正部１１２は、当該注目画素のＸがＭ−１より小さい場合には、Ｘ＋１の値をＸの値として置き直し、ＸがＭ−１である場合には、Ｘの値を１とし、Ｙ＋１の値をＹの値として置き直し、（Ｘ，Ｙ）の座標の画素を次の注目画素としてステップＳ５００からの処理を行う。補正部１１２は、注目画素の輝度値が２３０以上であって（ステップＳ５０１：Ｙｅｓ）、この注目画素の座標（Ｘ，Ｙ）が（Ｍ−１，Ｎ−１）であるときは、処理を終了し、全ての画素についての処理結果を制御部１４へ出力する。

注目画素の輝度値が２３０より小さい場合（ステップＳ５０１：Ｎｏ）、補正部１１２は、注目画素が情報伝達用画素であるか否か判定する（ステップＳ５０２）。ここでは、補正部１１２は、注目画素の輝度値が８０以下の場合に、情報伝達用画素であると判定する。ただし当該判定条件の情報伝達用画素の輝度値は、８０以下に限られない。

（５）の注目画素の輝度値が８０以下の場合（ステップＳ５０２：Ｙｅｓ）、補正部１１２は、当該注目画素に対し処理を行わず、次の注目画素へと処理を移行するか、処理を終了する。

注目画素の輝度値が８０より大きい場合（ステップＳ５０２：Ｎｏ）、補正部１１２は、図８に示される（１）、（４）、且つ（７）の各隣接画素（又は（１）、（４）、若しくは（７）の各隣接画素）の輝度値が２３０以上か否か、すなわちこれらの隣接画素が背景画素か否か判定を行う（ステップＳ５０３）。

（１）、（４）、且つ（７）の各隣接画素（又は（１）、（４）、若しくは（７）の各隣接画素）の輝度値が２３０より小さい場合には（ステップＳ５０３：Ｎｏ）、補正部１１２は、当該注目画素に対し、処理を行わず、次の注目画素へと処理を移行するか、処理を終了する。

（１）、（４）、且つ（７）の各隣接画素（又は（１）、（４）、若しくは（７）の各隣接画素）の輝度値が２３０以上の場合には（ステップＳ５０３：Ｙｅｓ）、補正部１１２は、図８に示される（３）、（６）、且つ（９）の各隣接画素（又は（３）、（６）、若しくは（９）の各隣接画素）の輝度値が８０以下か否か、すなわちこれらの隣接画素が情報伝達用画素か否か判定を行う（ステップＳ５０４）。

（３）、（６）、且つ（９）の各隣接画素（又は（３）、（６）、若しくは（９）の各隣接画素）の輝度値が８０より大きい場合（ステップＳ５０４：Ｎｏ）、補正部１１２は、当該注目画素に対し処理を行わず、次の注目画素へと処理を移行するか、処理を終了する。

（３）、（６）、且つ（９）の各隣接画素（又は（３）、（６）、若しくは（９）の各隣接画素）の輝度値が８０以下の場合（ステップＳ５０４：Ｙｅｓ）、補正部１１２は、（５）の注目画素と（６）の隣接画素の各輝度値の差の絶対値が、第４の閾値以上か否か判定する（ステップＳ５０５）。

（５）の注目画素と（６）の隣接画素の各輝度値の差の絶対値が、第４の閾値より小さい場合（ステップＳ５０５：Ｎｏ）、補正部１１２は、当該注目画素に対し処理を行わず、次の注目画素へと処理を移行するか、処理を終了する。

（５）の注目画素と（６）の隣接画素の各輝度値の差の絶対値が、第４の閾値以上の場合（ステップＳ５０５：Ｙｅｓ）、補正部１１２は、注目画素を背景画素へと置き換える。

補正部１１２は、上記ステップＳ５００からステップＳ５０６（又はステップＳ５０１、ステップＳ５０２、ステップＳ５０３、ステップＳ５０４、若しくはステップＳ５０５）までの処理を画像データにおける全ての画素について実行した後に、その処理を終了する。そして、補正部１１２又は背景処理部１１は、処理結果を文字解析・位置特定部１２へ出力する。

図１０は、認識装置１のハードウェア構成を例示する。
ここでは、認識装置１は、一般的なコンピュータとしてハードウェアを有し、認識装置１による処理は、以下に示すハードウェア６を具体的に利用することにより実行される。ハードウェア６は、互いにバス６０によって接続されたプロセッサ６１、メモリ６２、記憶装置６３、及び入出力インターフェース回路６４を備える。

プロセッサ６１は、例えばシングルコア、デュアルコア、又はマルチコアのプロセッサである。

メモリ６２は、例えばＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、又は半導体メモリである。

プロセッサ６１が、メモリ６２に記憶された情報、又は後述する記憶装置６３からメモリ６２に読み込んだ情報を用いて、メモリ６２に記憶された各種プログラムを実行することにより、背景処理部１１と文字解析・位置特定部１２と制御部１４の各機能が実現される。

記憶装置６３は、例えばハードディスクドライブ、光ディスク装置等であり、外部記憶装置や可搬型記憶媒体でもよい。プロセッサ６１が記憶装置６３に記憶されている文字に関する情報等を用いることにより、上記文字解析・位置特定部１２の機能が実現される。また、プロセッサ６１が記憶装置６３に記憶されている各種情報を用いることにより、上記背景処理部１１の機能が実現されてもよい。

入出力インターフェース回路６４は、認識装置１とスキャナ等の画像入力装置とを接続し、画像入力装置を介して認識装置１が画像データを取得するためのインターフェース回路を含む回路である。また入出力インターフェース回路６４は、画像読取結果等を出力するための、例えば、液晶ディスプレイ等の表示装置等と認識装置１とを接続するためのインターフェース回路を含む回路である。入出力インターフェース回路６４により、上記画像入力部１０と認識結果出力部１３の各機能が実現される。

なお、上述した場合以外にも、認識装置１の機能ブロックの全て、又はその一部の機能は、適宜、専用のハードウェアにより実現されることもできる。

以下、図１１から図１３、及び図５を参照し、本実施形態に係る認識装置１を用いた場合の効果について説明する。

図１１は、従来の文字認識の方法を用いた場合の出力結果を例示する。
図１１の左側は、スキャナ等の画像入力装置による入力の元となる書類上に付された画像を示す。書類は、例えば、健康保険証であり、当該健康保険証の券面において、ｃで示される背景部分は白色であり、ｄで示されるハッチングを施した背景部分には、例えば輝度が２３０より小さい値の色が施されているとする。従来の認識装置においては、上述したような色除去部１１０による色除去処理や、均一化部１１１による均一化処理は行われない。このため、背景がｃの部分と背景がｄの部分の境界部分の文字、例えば「○○１丁目１番１号」の文字における「丁」の付近には、色の変化によるノイズが発生してしまう。これにより、当該「丁」の文字が正確に読み取られない場合が生じ得る。このように互いに色が異なる２以上の背景に跨り表示されている文字は、従来の認識装置によれば、正確に認識されない場合があった。

図１２は、本実施形態に係る認識方法を用いた場合の、画像データの背景部分の出力結果を例示する。

図１１の場合と同様、図１２においてハッチングが付されている部分には、カラー（ここでは白以外の色を指し、黒や灰色も含む）が施されているとする。なお図１２において、ハッチングが濃ければ濃いほど、そのハッチングに対応する色が濃いものとする。

図１２の左側は、画像入力部１０による入力の元となる券面上に付された画像における背景部分、又は画像入力部１０を介して認識装置１に入力された画像の背景部分を示す。ここで、図１２の左側の画像におけるハッチング部分の画素の輝度値は、第１の閾値以上であるとする。色除去部１１０による処理により、図１２の左側の画像は、図１２における真ん中の画像へと変換される。この真ん中の画像におけるハッチング部分の画素の彩度値は、上記ステップＳ３０４（図３）より、０又は０に近い値である。また、この真ん中の画像における当該ハッチング部分の画素の明度値は、ステップＳ３０５の処理により、図１２の左側における元の画素の明度値よりも高い。これらから、図１２の真ん中の画像におけるハッチング部分の画素は、色除去部１１０による処理前の画素よりも明るい、より白に近い色に変換されていることがわかる。

図１２の右側には、均一化部１１１による処理後の画像の背景部分が示される。均一化部１１１によるステップＳ４０２（図４）の処理により、背景部分におけるグレー等の画素が、均一な背景画素（本実施形態では白色画素）へと変換されたことがこの図１２からわかる。

図１３は、色除去部１１０による処理及び均一化部１１１による処理の前後における各画像を例示する。

図１３においても、上記と同様、ハッチング部分はカラーを有する部分である。図１３は、画像において文字部分を表す情報伝達用画素も含めた場合を表す。

図１３の左側には、色除去部１１０による処理と均一化部１１１による処理の前の画像が示され、右側にはこれらの処理の後の画像が示される。ここに示されるように、本実施形態における色除去部１１０及び均一化部１１１により、背景の中に互いに大きく異なる色彩が付された部分がなくなり（図３のステップＳ３０４、ステップＳ３０５、図４のステップＳ４０２より）、背景が均一となり（ステップＳ４０２より）、複数の互いに異なる色彩部分同士の境界がなくなっている。これにより、文字認識におけるノイズの発生が低減する。また、背景画素の輝度値を大きい値とすることにより（ステップＳ４０２）、文字情報を構成する情報伝達用画素との差別化を図ることができ、文字情報が背景から抽出しやすいものとなる。

また図５の右側を参照すると、補正部１１２が、情報伝達用画素と背景画素との境界において、その境界の画素の輝度値と情報伝達用画素の輝度値の差の絶対値が大きい場合に（図９のステップＳ５０５）、当該境界の画素を背景画素へと置き換えることにより、情報伝達用画素の周囲のノイズとなる部分がなくなり、文字情報が正確に抽出されるようになる。

以上のことから、本実施形態に係る認識装置１によれば、背景デザインに関係なく、文字を正しく抽出できる。

（第２の実施形態）
上記第１の実施形態に係る認識装置１は、色除去部１１０による処理の後の画素であって、輝度値が第３の閾値以上の画素を背景用の画素とみなし、これを白色画素とした。しかしこの場合、第３の閾値が大きい場合などに、本来背景部分となるはずの画素が、第３の閾値よりもその輝度値が小さいために、背景画素への変換がされず、情報伝達用画素と共に画像上に残される可能性がある。そして、このような画素が文字認識等においてノイズとなる場合があり得る。

本実施形態に係る認識装置１´は、元の画像の各画素の輝度の分布を調べ、その分布に応じて背景画素とすべき画素を選択することで、情報伝達用画素の抽出においてノイズをより低減させ、より正確に必要な情報を抽出する。

本実施形態に係る認識装置１´は、図１に示されるように、上記認識装置１における均一化部１１１に代わり、均一化部１１１´を備える。この他の機能ブロックは、第１の実施形態におけるものと同様であるため、説明を省略する。

均一化部１１１´は、色除去部１１０から出力される色除去が行われた画像データへの処理に先立ち、未だ色除去部１１０により処理されていない画像データ、すなわち画像入力部１０により入力された元の画像データにおける画素の輝度のヒストグラム（輝度ヒストグラムとも記載する）を作成する。均一化部１１１´は、輝度が或る値となる画素の数をカウントし、各輝度値の画素数を記憶する。ここでは均一化部１１１´は、輝度値をインデックスとする配列である輝度配列［輝度値］を記憶し、このインデックスの輝度値の画素数をこの輝度配列［輝度値］に格納する。均一化部１１１´は、この任意の輝度値の輝度配列を輝度ヒストグラムとしてもよいし、この輝度配列に基づき生成したグラフを輝度ヒストグラムとしてもよい。

均一化部１１１´は、生成した輝度ヒストグラムに基づき、例えば１００以上の輝度値であって、最も多い画素数が分布する輝度値（ピーク輝度値とも記載する）を背景画素の輝度値とする。また均一化部１１１´は、ピーク輝度値における画素数を用いて、背景画素とすべき画素の輝度値の下限値を導出し、この下限値以上の輝度値の画素を背景画素として変換し、背景の均一化を行う。

図１４は、均一化部１１１´による輝度ヒストグラムの生成処理のフローチャートである。

均一化部１１１´は、制御部１４を介して画像入力部１０から背景処理部１１が取得した画像データの全ての各画素について、以下のステップＳ６００からステップＳ６０３（又はステップＳ６０２）までの処理を行う。

ステップＳ６００において、均一化部１１１´は、或る画素のＲＧＢ階調値から輝度値を算出する（ステップＳ６００）。

均一化部１１１´は、ステップＳ６００で算出した輝度値の画素数を格納する輝度配列［輝度値］のこの画素数に対し１を加算し、この加算後の値をこの輝度配列［輝度値］に格納する（ステップＳ６０１）。

均一化部１１１´は、ステップＳ６０１において加算処理と格納処理を行った輝度配列［輝度値］の画素数が１であるか否か判定する（ステップＳ６０２）。

この判定において画素数が１であれば（ステップＳ６０２：Ｙｅｓ）、均一化部１１１´は、ステップＳ６００においてその輝度値を算出した画素のＲＧＢ階調値を記憶する（ステップＳ６０３）。ここでは、均一化部１１１´は、ＲＧＢ階調値を記憶しておくためのＲＧＢサンプル領域を有し、当該ＲＧＢサンプル領域には、各輝度値をインデックスとする配列のＲＧＢサンプル［輝度値］が記憶され、ＲＧＢサンプル［輝度値］にはこのインデックスが示す輝度値におけるＲＧＢ階調値が格納される。このステップＳ６０３において均一化部１１１´は、ステップＳ６００において算出した輝度値をインデックスとするＲＧＢサンプル［輝度値］に、同じくステップＳ６００で当該輝度値の算出の元となったＲＧＢ階調値を格納する。

ステップＳ６０２の判定において画素数が１ではないとき、又は、ステップＳ６０３の処理が行われた後、均一化部１１１´は、少なくともステップＳ６００からステップＳ６０２までの処理が、未だ行われていない他の画素について、上記ステップＳ６００以降の処理を行う。また、ステップＳ６０２の判定において画素数が１ではなく、且つ全ての画素について少なくとも上記ステップＳ６００からステップＳ６０２までの処理が行われた場合、均一化部１１１´は、後述する図１６に示される処理を行う。また、ステップＳ６０３の処理が行われ、且つ全ての画素について少なくとも上記ステップＳ６００からステップＳ６０２までの処理が行われた場合、均一化部１１１´は、図１６に示される処理を行う。

図１５は、均一化部１１１´により生成される輝度ヒストグラムをグラフとして表現したものの一例を示す図である。

輝度ヒストグラムにおいて、横軸は輝度値、縦軸は画素数を表す。この図１５において、ｉとｊで示される互いに離れた２つのピークが存在する。ここでは、ｉにおける輝度値は小さく、ｊにおける輝度値は大きい。ｉにおける輝度値は、情報伝達用画素の輝度値であり、ｊにおける輝度値は、背景である画素の輝度値である。ｉとｊにより示されるように、背景である画素の大部分の輝度値と、情報伝達用画素の大部分の輝度値は、大きく異なる。また、ｋの部分に示されるように、ｉとｊの各輝度値の中間の輝度値における画素の数は多くないことがわかる。

図１６は、均一化部１１１´による背景の均一化処理のフローチャートである。
均一化部１１１´は、１００以上２５５以下の各輝度値をインデックスとする輝度配列［輝度値］を対象に、以下のステップＳ７００からステップＳ７０２の処理を実行する。ここでは、均一化部１１１´は、輝度値が１００の輝度配列［１００］から輝度値が２５５の輝度配列［２５５］まで、輝度値の昇順に以下のステップＳ７００からステップＳ７０２の処理を実行する。

ここで均一化部１１１´は、上述したピーク輝度値における画素数（ピーク画素数とも記載する）を記憶する。均一化部１１１´は、まず輝度配列［１００］を対象としたステップＳ７００からステップＳ７０２までの処理として、輝度配列［１００］の画素数をピーク画素数として記憶し、ピーク輝度値を１００として記憶する。あるいは、均一化部１１１´は、予めピーク画素数及びピーク輝度値として任意の初期値を設定し、以下の処理を実行してもよい。

均一化部１１１´は、輝度値がα（α：１００以上、２５５以下の整数）における輝度配列［α］の画素数が、記憶されているピーク画素数より大きいか否か判定を行う（ステップＳ７００）。

輝度配列［α］の画素数が、ピーク画素数より大きい場合には（ステップＳ７００：Ｙｅｓ）、均一化部１１１´は、ピーク画素数の値を輝度配列［α］の画素数に更新する（ステップＳ７０１）。そして均一化部１１１´は、ピーク輝度値をαへ更新する（ステップＳ７０２）。なお、ステップＳ７０１とステップＳ７０２の各処理は、上記順番とは逆の順番で実行されても、並列に実行されてもよい。

輝度配列［α］の画素数がピーク画素数以下の場合（ステップＳ７００：Ｎｏ）、又はステップＳ７０２の処理の後、均一化部１１１´は、αが２５５より小さいときは、輝度配列［α＋１］を対象としてステップＳ７００以降の上記の処理を実行する。

αが２５５のときであって、輝度配列［α］の画素数がピーク画素数以下の場合（ステップＳ７００：Ｎｏ）、又はステップＳ７０２の処理後、均一化部１１１´は、ＲＧＢサンプル［ピーク輝度値］に格納されたＲＧＢ階調値を取得する（ステップＳ７０３）。均一化部１１１´は、ステップＳ７０３で得られたＲＧＢ階調値を、背景画素のＲＧＢ階調値とする。

次に、均一化部１１１´は、背景画素として置き換えるための画素の輝度値の下限値（上記第１の実施形態における第３の閾値に相当し、背景下限値とも記載する）を算出するため、輝度値の降順に、ピーク輝度値から１００までの各輝度値における輝度配列［輝度値］を対象とし、以下のステップ７０４からステップＳ７０５の処理を、実行する。

まず均一化部１１１´は、背景下限値として、ピーク輝度値を記憶しておく。均一化部１１１´は、輝度値がβ（β：１００以上でピーク輝度値以下）の輝度配列［β］の画素数がピーク画素数の例えば６０％以上になるか否か判定する（ステップＳ７０４）。ただし、ここでの判定条件はピーク画素数の６０％以上とは限られず、例えば５０％や７０％等でもよい。

輝度配列［β］の画素数がピーク画素数の例えば６０％以上であるならば（ステップＳ７０４：Ｙｅｓ）、均一化部１１１´は、背景下限値をβに更新する（ステップＳ７０５）。

輝度配列［β］の画素数がピーク画素数の例えば６０％未満の場合（ステップＳ７０４：Ｎｏ）、又はステップＳ７０５の処理後、均一化部１１１´は、βが１００より大きいときは、輝度配列［β−１］を対象としてステップＳ７０４以降の上記の処理を実行する。

βが１００のときであって、輝度配列［β］の画素数がピーク画素数の例えば６０％未満の場合（ステップＳ７０４：Ｎｏ）、又はステップＳ７０５の処理後、均一化部１１１´は、以下に述べるステップＳ７０６以降の処理を実行する。

ここで、背景下限値について、図１５を再度参照して説明する。図１５において、ピーク輝度値は、ｊにおける輝度値となる。そして、輝度値がピーク輝度値から下がり、情報伝達用画素が分布する輝度値へ近づくにつれ、画素数は減少していく。本実施形態では、ピーク輝度値における画素数の例えば６０％以上の画素数となる輝度値であって、１００以上の輝度値を背景下限値としている。これにより１００に近い輝度値の画素も背景用の画素か否かの考慮がされ、背景とすべき画素が漏れなく抽出されることができる。なお、図９のステップＳ５０４の場合のように、輝度値が例えば８０以下の画素を情報伝達用画素としても、図１５におけるｉに相当するピークにおける情報伝達用画素の画素数や、このｉに相当するピーク近傍の輝度値の画素数は、ピーク画素数の６０％程度には及ばない場合が多いので、１００以上の輝度値を背景用の輝度値として考慮しても、情報伝達用画素が背景用の画素として取り扱われる可能性は低いと考えられる。

次に均一化部１１１´は、色除去部１１０により色の除去がされた画像データの全ての画素について、以下のステップS７０６からステップS７０８（又はステップS７０７）までの処理を実行する。均一化部１１１´は、或る画素のＲＧＢ階調値から輝度値を算出する（ステップＳ７０６）。均一化部１１１´は、ステップＳ７０６において算出した輝度値が、上述した処理により得られた背景下限値以上か否か判定を行う（ステップＳ７０７）。

ステップＳ７０７において、輝度値が背景下限値以上の場合には（ステップＳ７０７：Ｙｅｓ）、均一化部１１１´は、当該画素を、ＲＧＢサンプル［ピーク輝度値］に格納されているＲＧＢ階調値の画素へ置き換える（ステップＳ７０８）。なお、均一化部１１１´は、ＲＧＢサンプル［ピーク輝度値］に格納されているＲＧＢ階調値の画素への置き換えに代えて、当該画素を例えば白色画素へと置き換えてもよい。

ステップＳ７０７において、輝度が背景下限値より小さい場合（ステップＳ７０７：Ｎｏ）、又はステップＳ７０８の処理後、均一化部１１１´は、ステップＳ７０６の処理が未だ実行されていない他の画素について、上記ステップＳ７０６以降の処理を繰り返す。

全ての画素について、上記ステップＳ７０６からステップＳ７０８（又はステップＳ７０７）までの処理を実行した均一化部１１１´は、処理を終了すると共に、補正部１１２に対し、処理後の画像データを出力する。

補正部１１２は、図９におけるステップＳ５０１の判定条件を、注目画素の輝度値が背景下限値以上か否かとする判定条件を用いて処理を実行する。また補正部１１２は、ステップＳ５０３における判定条件を、例えば（１）、（４）、且つ（７）の各隣接画素（（１）、（４）、又は（７）の各隣接画素）の輝度値が背景下限値以上か否かとする判定条件を用いて処理を実行する。

本実施形態に係る認識装置１´の各機能ブロックも、図１０に示すハードウェア６により実現可能であり、機能ブロックとハードウェア６の構成要素の対応関係は、上記第１の実施形態と同様である。また認識装置１´の機能ブロックの全て、又はその一部の機能は、適宜、専用のハードウェアにより実現されることができることも、上記第１の実施形態と同様である。

本実施形態に係る認識装置１´によれば、上記第１の実施形態における効果に加え、以下の効果を得ることができる。認識装置１´は、背景用の画素となるべき画素を、漏れなく抽出することができる。そして認識装置１´は、漏れなく抽出された背景画素となるべき画素をピーク輝度値の画素へ置き換えることにより、情報伝達用画素を背景画素からより区別しやすいものにし、文字等の情報を正確に抽出する。

本発明は、本発明の広義の精神と範囲を逸脱することなく、様々な実施形態及び変形が可能とされるものである。また、上述した実施形態は、本発明を説明するためのものであり、本発明の範囲を限定するものではない。特許請求の範囲内及びそれと同等の発明の意義の範囲内で施される様々な変形も、本発明の範囲内とみなされる。

１、１´ 認識装置
６ハードウェア
１０画像入力部
１１背景処理部
１２文字解析・位置特定部
１３認識結果出力部
１４制御部
６０バス
６１プロセッサ
６２メモリ
６３記憶装置
６４入出力インターフェース回路
１１０色除去部
１１１、１１１´ 均一化部
１１２補正部

Claims

取得した画像データにおける画素の輝度値が第１の閾値以上で、前記画素の彩度値が第２の閾値以上の場合に、前記画素の彩度値を、前記第２の閾値以下である第１の彩度値とする色除去部と、
前記画素の輝度値が第３の閾値以上の場合に、前記画素を背景画素に置き換える均一化部と、
前記画像データにおける画素のうち、前記背景画素と情報伝達用画素の間に位置する前記画素と、前記情報伝達用画素のそれぞれの輝度の差の絶対値が第４の閾値以上の場合に、前記背景画素と情報伝達用画素との間に位置する画素を、前記背景画素へと置き換える補正部と、
を備えることを特徴とする認識装置。
前記第３の閾値は２３０であることを特徴とする請求項１に記載の認識装置。
前記均一化部は、前記画像データにおける全ての画素の各輝度値を算出し、該各輝度値の前記画素の数のうちの画素数であって、該画素数が最大となるピーク輝度値を導出し、該ピーク輝度値に基づいて、輝度値の背景下限値を導出し、該背景下限値を前記第３の閾値とすることを特徴とする請求項１に記載の認識装置。
前記均一化部は、１００以上の前記各輝度値のうち、前記画素数が前記ピーク輝度値の画素数の所定の割合以上の数となる、最小の輝度値を前記背景下限値とすることを特徴とする請求項３に記載の認識装置。
前記所定の割合は、６割であることを特徴とする請求項４に記載の認識装置。
前記背景画素の輝度値は、前記ピーク輝度値であることを特徴とする請求項３から５の何れか１項に記載の認識装置。
前記均一化部は、前記背景画素のＲＧＢ階調値を、前記ピーク輝度値における、任意の１つの前記画素のＲＧＢ階調値とすることを特徴とする請求項６に記載の認識装置。
前記均一化部は、前記背景画素のＲＧＢ階調値を、前記ピーク輝度値における前記画素のうち最初に輝度値が算出された前記画素のＲＧＢ階調値とすることを特徴とする請求項６又は７に記載の認識装置。
前記背景画素は、白色画素であることを特徴とする請求項１から５の何れか１項に記載の認識装置。
前記情報伝達用画素は、輝度値が８０以下の前記画素であることを特徴とする請求項１から９の何れか１項に記載の認識装置。
前記情報伝達用画素は、黒色画素であることを特徴とする請求項１から１０の何れか１項に記載の認識装置。
前記第１の彩度は、０．１以下の数であることを特徴とする請求項１から１１の何れか１項に記載の認識装置。
前記第１の彩度は、０であることを特徴とする請求項１から１２の何れか１項に記載の認識装置。
取得した画像データにおける画素の輝度が第１の閾値以上で、前記画素の彩度が第２の閾値以上の場合に、前記画素の彩度を、前記第２の閾値以下である第１の彩度とし、
前記画素の輝度が第３の閾値以上の場合に前記画素を背景画素に置き換え、
前記画像データにおける画素のうち、前記背景画素と情報伝達用画素の間に位置する画素と、前記情報伝達用画素のそれぞれの輝度の差が第４の閾値以上の場合に、前記背景画素と前記情報伝達用画素との間に位置する画素を、前記背景画素へと置き換える、
処理をコンピュータが実行することを特徴とする認識プログラム。
取得した画像データにおける画素の輝度が第１の閾値以上で、前記画素の彩度が第２の閾値以上の場合に、前記画素の彩度を、前記第２の閾値以下である第１の彩度とし、
前記画素の輝度が第３の閾値以上の場合に前記画素を背景画素に置き換え、
前記画像データにおける画素のうち、前記背景画素と情報伝達用画素の間に位置する画素と、前記情報伝達用画素のそれぞれの輝度の差が第４の閾値以上の場合に、前記背景画素と前記情報伝達用画素との間に位置する画素を、前記背景画素へと置き換える、
認識装置により実行される認識方法。