JP2013020617A - グレースケール文字画像正規化装置及び方法 - Google Patents
グレースケール文字画像正規化装置及び方法 Download PDFInfo
- Publication number
- JP2013020617A JP2013020617A JP2012152525A JP2012152525A JP2013020617A JP 2013020617 A JP2013020617 A JP 2013020617A JP 2012152525 A JP2012152525 A JP 2012152525A JP 2012152525 A JP2012152525 A JP 2012152525A JP 2013020617 A JP2013020617 A JP 2013020617A
- Authority
- JP
- Japan
- Prior art keywords
- character image
- gradation
- grayscale character
- grayscale
- normalization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Input (AREA)
- Facsimile Image Signal Circuits (AREA)
Abstract
【課題】グレースケール文字画像正規化装置及び方法を提供する。
【解決手段】グレースケール文字画像正規化方法は、コンピュータが、認識されるグレースケール文字画像の階調分布パラメータを取得する階調分布パラメータ取得処理、及び、前記認識されるグレースケール文字画像の階調分布パラメータを、トレーニングサンプルであるグレースケール文字画像から得られた階調分布パラメータに近似させる階調分布パラメータ正規化処理を行うことを特徴とする。
【選択図】図1
【解決手段】グレースケール文字画像正規化方法は、コンピュータが、認識されるグレースケール文字画像の階調分布パラメータを取得する階調分布パラメータ取得処理、及び、前記認識されるグレースケール文字画像の階調分布パラメータを、トレーニングサンプルであるグレースケール文字画像から得られた階調分布パラメータに近似させる階調分布パラメータ正規化処理を行うことを特徴とする。
【選択図】図1
Description
本発明は、文字認識の技術に関し、特に、グレースケール文字認識の技術に関する。
従来の光学文字認識(Optical Character Recognition:OCR)の技術は、文章の文字を走査しながら認識することに着眼されるものである。一般的には、前景と背景とが容易に仕分けできる場合、従来の2値化画像による文字認識は精度の高い認識を行うことができる。近年、益々多くなる文字認識への要求は、カメラによるドキュメント画像、web画像及び自然シーン画像に由来している。それらの画像には、文字がそれほど明瞭ではなく、且つ背景もきれいではないものが多い。更に言うと、低解像度、ぼやけ、歪み、日照の変化や複雑な背景などのような、画像の品質を低下する多くの要因は、それらの画像に反映し易い。それらの要因の全てによって、自然シーン画像における文字の認識が非常に難しく、挑戦性に富むことになる。それらの画像から文字を正確に抽出するのがとても困難なことであり、そのため、従来の2値化文字認識方法はその本来の機能を果せないことになる。
また、文字認識エンジンでは、通常、サイズの固定される文字画像しか受け取れないので、多くの文字画像がそのままでその要求を満足することができない。従って、文字を認識するに先立って、エンジンの要求する画像サイズに正規化する必要がある。通常の2値化による文字認識では、分割し易いためには文字画像の背景がきれいと仮定するが、自然シーン画像がその仮定を満足できない場合は多い。サイズを正規化する際に文字のアスペクト比を維持すると(即ち、コンフォーマル変換)、文字の周辺に白いストリップが形成されるから、グレースケール文字認識に大いに不良な影響を与える。
本発明の目的は、従来技術の不備による一種類以上の不具合を解消又は緩和することができるグレースケール文字画像正規化装置及びグレースケール文字画像正規化方法を提供することにある。
上記の課題を解決するために、本発明の一実施例によれば、グレースケール文字画像正規化方法が提供される。このグレースケール文字画像正規化方法は、コンピュータが、 認識されるグレースケール文字画像の階調分布パラメータを取得する階調分布パラメータ取得処理、及び、前記認識されるグレースケール文字画像の階調分布パラメータを、トレーニングサンプルであるグレースケール文字画像から得られた階調分布パラメータに近似させる階調分布パラメータ正規化処理を行うことを特徴とする。
本発明の実施例によれば、グレースケール文字画像正規化装置及びグレースケール文字画像正規化方法を提供することができるという効果が得られる。
以下、図面を参照しながら本発明の実施例を詳しく説明する。
本発明の実施例によれば、自然シーン画像における文字を認識する際に、一般では次のようなことを実施する。
(1)カラー文字画像をグレースケール化し、グレースケール文字画像を得ること。
(2)グレースケール文字画像を正規化すること。
(3)グレースケール文字を認識すること。
それ以外の方法も当業者によく知られるので、本明細書ではその説明を省略する。グレースケール文字を認識するには、例えば畳み込みニューラルネットワーク(Convolutional Neural Network:CNN)分類器により自然シーン画像中の文字を認識する方法のように本分野で周知される様々な方法も利用できる。
グレースケール文字画像正規化として、グレースケール文字画像のサイズ正規化と階調分布正規化との2者でもよく、または2者のうちの1者でもよい。
グレースケール文字画像正規化は、グレースケール文字画像のサイズ正規化と階調分布正規化との2者を含む場合、グレースケール文字画像のサイズ正規化及び階調分布正規化は任意の順序で行われることができる。
次に、本発明の一実施例によるグレースケール文字画像正規化の方法を説明する。
図1は、本発明の一実施例によるグレースケール文字画像の階調分布正規化方法を示すフローチャートである。なお、このフローチャートにおける処理は、例えば、コンピュータにより実行されてもよい。
図1に示すように、本発明の一実施例によるグレースケール文字画像の階調分布正規化方法では、まず、ステップS101では、認識されるグレースケール文字画像の階調分布パラメータを取得する。この階調分布パラメータは、例えば、この認識されるグレースケール文字画像の階調数及びその諧調値の平均値である。次に、ステップS102では、予め保存された、トレーニング文字画像サンプル(サンプル画像)から得られた階調分布パラメータ、及び得られたこの認識されるグレースケール文字画像の階調分布パラメータを用いて、認識されるグレースケール文字画像の各画素の階調値を変換することにより、認識されるグレースケール文字画像の階調分布パラメータをトレーニングサンプルであるグレースケール文字画像の階調分布パラメータに近似させ、認識されるグレースケール文字画像の階調分布の正規化を図れるようにする。このステップは、階調分布アラインメント(較正)ステップとも言われる。
ここで、sは階調範囲の尺度因子を、cは認識されるグレースケール文字画像の階調値の平均値を、Cはトレーニングサンプルであるグレースケール文字画像から予め得られた階調値の平均値をそれぞれ示す。また、xは認識されるグレースケール文字画像の画素の階調値を、a(x)は変換後の認識されるグレースケール文字画像の画素の階調値をそれぞれ示す。
一例では、s=L/lとし、ここで、Lはトレーニングサンプルであるグレースケール文字画像の階調数を、lは認識されるグレースケール文字画像の階調数をそれぞれ示す。
他の一例では、sは下記の式により算出できる。
他の一例では、sは下記の式により算出できる。
ここで、パラメータであるgは本分野では平滑係数とも言われ、例えばその値が2.0を取り、もちろん、具体的な応用状況及び経験により他の値を取ってもよい。
本実施例は階調分布を正規化することにより、トレーニングサンプルとテストサンプルとの一致性を高め、文字認識システムの性能を高めることができる。
図1に戻し、上述のグレースケール文字画像の階調分布正規化方法は、階調分布アラインメントが実施された後の認識されるグレースケール文字画像の前景色と背景色との間の距離を拡大するステップを更に含む(ステップS103)。
好ましくは、階調分布アラインメントが実施された後の認識されるグレースケール文字画像の前景色と背景色との間の距離を拡大するとともに、この階調分布アラインメントが実施された後の認識されるグレースケール文字画像の階調数を変更しない。
ここで、lは認識されるグレースケール文字画像の階調数を、aは補強される強さを制御する因子をそれぞれ示す。aは予め決められてもよい。xは認識されるグレースケール文字画像の画素の階調値を、f(x)は認識されるグレースケール文字画像の画素の変換後の階調値をそれぞれ示す。
ここで、現在の文字画像の階調範囲は
であるときに、lは現在の文字画像の階調数を、cは階調範囲の中央を、aは補強される強さを制御する因子を、xは認識されるグレースケール文字画像の画素の階調値を、f(x)は認識されるグレースケール文字画像の画素の変換後の階調値をそれぞれ示す。
ここで、lは現在の文字画像の階調数を、cは階調範囲の中央を、aは補強される強さを制御する因子を、xは認識されるグレースケール文字画像の画素の階調値を、f(x)は認識されるグレースケール文字画像の画素の変換後の階調値をそれぞれ示す。
なお、ステップS103は選択可能なステップであり、省略してもよい。文字画像は本質的には前景と背景との2部分からなるので、本方法のステップS103では前景(文字)と背景との間の仕分け可能性を高め、グレースケール文字画像における文字認識情報の利用可能性を高めることができる。
図2は階調ヒストグラムでステップS103の技術的効果を示す模式図である。図2に示すように、2つのピークは認識される画像の背景の階調値と前景の階調値をそれぞれ示し、即ちこの2つのピークはそれぞれ背景のピークと前景のピークである。本実施例によれば、ステップS103を適用すると、背景のピークと前景のピークとの間の距離を拡大でき、システムの性能を高めることができる。
図3は、認識されるグレースケール文字画像を黒地に白い文字の文字画像に統一して変換する場合の本発明の一実施例によるグレースケール文字画像のコンフォーマルサイズ正規化方法を示すフローチャートである。なお、このフローチャートにおける処理は、例えば、コンピュータにより実行されてもよい。
「黒地に白い文字」とは、本明細書では、グレースケール文字画像は背景色の階調値よりも前景色のほうが高い場合を意味する。同様に、後述の「白地に黒い文字」とは、本明細書では、グレースケー文字画像は背景色の階調値よりも前景色のほうが低い場合を意味する。
図3に示すように、本発明の一実施例によるグレースケール文字画像のサイズ正規化方法では、まず、ステップS301では、グレースケール文字画像における縁部画素の階調値の平均値(平均値1)を算出する。次に、ステップS302では、グレースケール文字画像全体における全画素の階調値の平均値(平均値2)を算出する。次に、ステップS303では、反対色であるか否かを判定する。即ち、前記コンフォーマル正規化をしようとするグレースケール文字画像の前景色と背景色との階調値の関係は、所望のグレースケール文字画像の前景色と背景色との階調値の関係とは反対になっているか否かを判定する。この図に例示する実施例では、所望のグレースケール文字画像は黒地に白い文字の文字画像であり、即ち所望のグレースケール文字画像は背景色の階調値よりも前景色のほうが高いからである。従って、ステップS303では、この認識されるグレースケール文字画像は白地に黒い文字のグレースケール文字画像であるか否かを判定する。一実施例では、ステップS301で得られた文字画像における縁部画その階調値の平均値(平均値1)を、ステップS302で得られたグレースケール文字画像全体における全画素の階調値の平均値(平均値2)と比較し、平均値2よりも平均値1のほうが大きければ(ステップS303:Yes)、即ち画像の縁部の階調値が高ければ、その画素が画像全体よりも更に白めになり(例えば、階調値が0−255の256個の値である場合、白い画素の階調値が255、黒い画素の階調値が0となる)、この文字画像が反対色画像であることを意味している。この場合、処理がステップS304に移行し、色反転(階調反転とも言える)を行う。色反転は各画素の階調値を、最も大きい階調値(例えば255)から当該画素の階調値を引いて得た当該画素の新しい階調値に変更することで行われる。一方、平均値2よりも平均値1のほうが小さければ(ステップS303:No)、即ち画像の縁部画素が画像全体の全画素よりも更に黒くなれば、その画素が反対色画像ではないことを意味し、処理がそのままステップS305に移行する。ステップS305では、前記グレースケール文字画像の背景色を推算する。次に、ステップS306では、当該グレースケール文字画像に対してコンフォーマル正規化を実施する。即ち文字画像のアスペクト比を維持するための正規化変換を行う。次に、ステップS307では、コンフォーマル正規化を実施された前記グレースケール文字画像の空白エリアの色をステップS305で推算された前記画像エリアの背景色に設定する。図に示す実施例では、背景を推算するステップS305では、縁部画素の最も小さい階調値を背景の階調値とする。別の一実施例では、前記グレースケール文字画像における縁部画素の平均諧調値を前記背景の階調値とする。
なお、上記のステップS301−S304では、文字画像を黒地に白い文字の画像に統一して設定している。しかし、本発明は白地に黒い文字の画像にも適用できる。
図4は認識されるグレースケール文字画像を白地に黒い文字のグレースケール文字画像に統一して変換する場合の本発明の実施例による文字画像のコンフォーマル正規化を示すフローチャートである。なお、このフローチャートにおける処理は、例えば、コンピュータにより実行されてもよい。
図4に示すように、白地に黒い文字の画像に統一して変換される文字画像の場合、ステップS303ではYesと判定されると、ステップS305’の処理に移行する一方、ステップS303ではNoと判定されると、ステップS304の色反転処理を行う。また、白地に黒い文字の場合、ステップS305’では、縁部画素の最も大きい階調値を背景の階調値とする。同様には、本実施例では、前記グレースケール文字画像における縁部画素の平均諧調値を前記背景の階調値としてもよい。
処理される文字画像が白地に黒い文字の文字画像又は黒地に白い文字の文字画像か予めわかる場合、或いは本方法の適用範囲に制限がある場合では(例えば、白地に黒い文字の文字画像のみに又は黒地に白い文字の文字画像のみに適用する場合)、ステップS301−S304の処理を省略できるのに注意する必要がある。
図5は本発明によるコンフォーマル正規化方法と通常のグレースケール文字画像正規化方法との比較を示す。図5aはグレースケール文字画像正規化がなされていないグレースケール文字画像(即ち元の画像)を、図5bは図5aに示すグレースケール文字画像に通常の非コンフォーマル正規化方法を適用した結果を、図5cは図5aに示すグレースケール文字画像に通常のコンフォーマル正規化方法を適用した結果を、図5dは本発明によるグレースケール文字画像のコンフォーマル正規化方法を適用した結果をそれぞれ示す。
図5bに示すように、コンフォーマル変換をされていない場合、文字画像のアスペクト比は大いに変化している。図5cに示すように、通常のコンフォーマル正規化方法を適用したところ、コンフォーマル正規化をされた画像に白いストリップが現した現象を発生している。図5dに示す本発明の方法による正規化された画像には上記の問題が発生していない。
従って、本発明は背景推算及び背景充填を利用して常例技術による白いストリップ現象を良好的に解消したことがわかる。
図6は本発明の一実施例によるグレースケール文字画像の階調分布正規化装置を示すブロック図である。図6に示すように、本発明の一実施例によるグレースケール文字画像の階調分布正規化装置は、階調分布パラメータ決定手段601と、階調分布アラインメント手段602と、ダブルピーク補強手段603とを備える。階調分布パラメータ決定手段601は、認識されるグレースケール文字画像の階調分布パラメータ、例えば諧調数及び諧調値の平均値を決定するものである。
階調分布アラインメント手段602は、階調分布パラメータ決定手段601で決定された階調分布パラメータ及びトレーニング画像(トレーニングサンプル)から予め決定された階調分布パラメータに基づき、認識されるグレースケール文字画像の各画素の階調値を変換することにより、前記認識されるグレースケール文字画像の階調分布をトレーニングサンプルであるグレースケール文字画像の階調分布に近似させ、前記グレースケール文字画像の階調分布の正規化を図れるようにする。
ダブルピーク補強手段603は階調分布アラインメントを実施された前記認識されるグレースケール文字画像の前景色と背景色との間の距離を拡大するものである。好ましくは、階調分布アラインメントを実施された前記認識されるグレースケール文字画像の前景色と背景色との間の距離を拡大するとともに、このヒストグラムアラインメントを実施された、認識されるグレースケール文字画像の階調数を変更しない。
ここで、lは現在の文字画像の階調数を、aは補強される強さを制御する因子をそれぞれ示す。aは予め決められてもよい。
図7は本発明の一実施例によるグレースケール文字画像のサイズ正規化装置を示す。図7に示すように、本発明の一実施例によれば、サイズ正規化装置は反対色判定手段701と、反対色修正手段702と、背景推算手段703と、コンフォーマル変換手段704と、背景充填手段705とを備える。
反対色判定手段701は文字画像における縁部画素の階調値の平均値(平均値1)を算出して、グレースケール文字画像全体の全画素の階調値の平均値(平均値2)を算出してから、反対色であるか否かを判定する。例えば、所望の文字画像は白地に黒い文字の画像であれば、このグレースケール文字画像における縁部画素の階調値の平均値(平均値1)を、グレースケール文字画像全体の全画素の階調値の平均値(平均値2)と比較し、平均値2よりも平均値1のほうが小さければ、即ち画像の縁部の階調値が低ければ、縁部画素の黒さが画像全体の黒さよりも更に黒くなることを意味するので、この文字画像が反対色画像であると判定できる。一方、平均値2よりも平均値1のほうが大きければ、即ち画像の縁部画素が画像全体の全画素よりも更に白ければ、反対色画像ではないことを意味する。
一方、所望の文字画像は黒地に白い文字の画像であれば、このグレースケール文字画像における縁部画素の階調値の平均値(平均値1)を、グレースケール文字画像全体の全画素の階調値の平均値(平均値2)と比較し、平均値2よりも平均値1のほうが大きければ、即ち画像の縁部の階調値が高ければ、縁部画素の黒さが画像全体の黒さよりも更に白めになることを意味するので、この文字画像が反対色画像であると判定できる。一方、平均値2よりも平均値1のほうが小さければ、即ち画像の縁部画素が画像全体の全画素よりも更に黒ければ、反対色画像ではないことを意味する。
反対色修正手段702は反対色画像を所望の画像に修正する。例えば、所望のグレースケール文字画像は白地に黒い文字の画像であれば、反対色画像を白地に黒い文字の画像に修正する。これは、例えば当該グレースケール文字画像の各画素に対して、最も大きい階調値から当該画素の階調値を引いて得たものを当該画素の新しい階調値として上記の修正を行うことで実施することができる。
同様に、処理される文字画像が白地に黒い文字の文字画像か又は黒地に白い文字の文字画像か予めわかる場合、或いは本装置の適用範囲に制限がある場合では(例えば、白地に黒い文字の文字画像のみに又は黒地に白い文字の文字画像のみに適用する場合)、当該反対色判定手段701及び当該反対色修正手段702を省略することができる。
背景推算手段703は前記グレースケール文字画像の背景色を推算する。一実施例では、例えば所望のグレースケール文字画像は白地に黒い文字の画像である場合、縁部画素の最も大きい階調値を背景の階調値とする。所望のグレースケール文字画像は黒地に白い文字の画像である場合、縁部画素の最も小さい階調値を背景の階調値とする。別の一実施例では、前記グレースケール文字画像における縁部画素の平均階調値を前記背景の階調値に決定する。
コンフォーマル正規化手段704は当該グレースケール文字画像に対してコンフォーマル正規化、即ち文字画像のアスペクト比を維持する正規化を実施する。
背景充填手段705は前記グレースケール文字画像の空白エリアの色を背景推算手段703で推算された前記画像エリアの背景色に充填する。
グレースケール文字画像の階調分布正規化装置及びグレースケール文字画像のサイズ正規化装置はグレースケール文字画像正規化装置を一体的に構成することができる。
なお、ここでは、装置についての記載及び方法についての記載は互いに参照し合い、互いに理解し合うことができる。一実施例で記載された特徴は同一又は類似的な形態で別の一実施例に適用され、当該別の一実施例における特徴を代える又は当該別の一実施例における特徴と共に利用することができる。
本発明の実施例よれば、まず階調分布アラインメインによる階調分布正規化方法を提案し、それによってトレーニングサンプルと認識されるサンプルとの間のデータの一致性を高めるので、分類精度の改善に寄与できる。トレーニングサンプルセットの階調分布を学習し、それを基にして測定されるサンプルに階調分布正規化を実施することにより、測定されるサンプルにトレーニングサンプルセットと近似な階調分布を持たせ、グレースケール文字認識の性能を向上することができる。
さらに、文字画像は本質的には前景と背景との2部分からなるので、本発明の実施例による方法では、ダブルピークヒストグラム補強技術を利用して前景(文字)と背景との間の仕分け可能性を高め、グレースケール文字画像における文字認識情報の利用可能性を高めることができる。
更には、本発明の実施例による正規化方法では、背景を推算し、且つコンフォーマルサイズ正規化による、白いストリップに背景を充填することにより、白いストリップによる文字認識への影響を避けることができる。
上述した装置及び方法はハードウエアで実現してもよく、ハードウエアとフォームウエアとソフトウエアとの組み合わせによって実現してもよい。上述した装置及び方法は、例えば論理素子で実行する(直接実行する、或いは解析やコンパイリングしてから実行する)ことにより、当該論理素子に上述した装置又は構成要素を実現させ、或いは当該論理素子に上述した各方法又はステップを実現させる論理素子読み取り可能なプログラムに関する。論理素子は例えばフィルドプログラム可能な論理素子(Field Programmable Gate Array:FPGA)、特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)、デジタル信号プロセッサー(Digital Signal Processing:DSP)、マイクロプロセッサー、コンピュータに用いられるプロセッサーなどである。本発明は、例えばハードディスク、磁気ディスク、光ディスク、DVD、フラッシュメモリ、磁気光ディスク、メモリカード、メモリスティックなどのように上記プログラムを記憶する記憶媒体に更に関する。
図8は本発明の実施例による方法及び装置を実施するコンピュータを示す模式的ブロック図である。
図8では、中央処理手段(CPU)801はリードオンリーメモリ(ROM)802に記憶されたプログラム又は記憶部808からランダムアクセスメモリ(RAM)803にロードされたプログラムに基づき、様々な処理を実行する。必要に応じて、CPU 801が様々な処理を実行するなどの場合に必要とするデータもRAM 803に記憶されている。CPU 801、ROM 802及びRAM 803はバス804を介して互いに接続されている。入力/出力インタフェース805もバス804に接続している。
入力/出力インタフェース805には、入力部806(キーボード、マウスなどを含む)、出力部807(陰極線管 (Cathode Ray Tube:CRT)や液晶表示器(LCD)などのようなディスプレイ、及びスピーカなどを含む)、記憶部808(ハードディスクなどを含む)、通信部809(LANカードのようなネットワークインタフェースカード、モデムなどを含む)が接続されている。通信部809はインターネットのようなネットワークを介して通信処理を行う。必要に応じて、入力/出力インタフェース805にドライブ810も接続されている。必要な場合では、ドライブ810に例えば磁気ディスク、光ディスク、磁気光ディスク、半導体メモリなどのような脱着可能な媒体811が装着されることにより、その媒体から読み出されたコンピュータプログラムが必要に応じて記憶部808にインストールされる。
上述した一連の処理をソフトウエアで実現する場合では、例えばインターネットのようなネットワーク又は脱着可能な媒体811のような記憶媒体からソフトウエアを構成するプログラムをインストールする。
このような記憶媒体は、図8に示すようにプログラムが記憶され、ユーザにプログラムを供給するように装置と別体で割当てられる脱着可能な媒体811には限られないことが当業者は理解できるだろう。脱着可能な媒体811の例として、磁気ディスク(ソフトディスク(登録商標)を含む)、光ディスク(光ディスクロードオンリーメモリ(CD−ROM)及びデジタルバーサティルディスク(DVD)を含む)、磁気光ディスク(ミニディスク(MD)(登録商標)を含む))、半導体メモリが挙げられる。或いは、記憶媒体はプログラムが記憶され且つそれを内蔵する装置とともにユーザに割当てられるROM802、記憶部808に含まれるハードディスクなどであってもよい。
以上、本発明の好ましい実施例を説明したが、本発明はこの実施例に限定されず、本発明の趣旨を離脱しない限り、本発明に対するあらゆる変更は本発明の技術的範囲に属する。
以上の実施例を含む実施形態に関し、更に以下の付記を開示する。
(付記1)
コンピュータが、認識されるグレースケール文字画像のグレースケール分布パラメータを取得するグレースケール分布パラメータ取得処理、及び、前記認識されるグレースケール文字画像のグレースケール分布パラメータをトレーニングサンプルであるグレースケール文字画像から得られたグレースケール分布パラメータに近似させるグレースケール分布パラメータ正規化処理を行うグレースケール文字画像正規化方法。
コンピュータが、認識されるグレースケール文字画像のグレースケール分布パラメータを取得するグレースケール分布パラメータ取得処理、及び、前記認識されるグレースケール文字画像のグレースケール分布パラメータをトレーニングサンプルであるグレースケール文字画像から得られたグレースケール分布パラメータに近似させるグレースケール分布パラメータ正規化処理を行うグレースケール文字画像正規化方法。
(付記2)
付記1に記載の方法において、前記認識されるグレースケール文字画像のグレースケール分布パラメータは、前記認識されるグレースケール文字画像のグレースケール数及びそのグレースケール平均値である。
付記1に記載の方法において、前記認識されるグレースケール文字画像のグレースケール分布パラメータは、前記認識されるグレースケール文字画像のグレースケール数及びそのグレースケール平均値である。
(付記3)
付記2に記載の方法において、
により、前記認識されるグレースケール文字画像のグレースケール分布パラメータをトレーニングサンプルであるグレースケール文字画像から得られたグレースケール分布パラメータに近似させ、ここで、xは認識されるグレースケール文字画像の画素の階調値を、a(x)は認識されるグレースケール文字画像の画素の変換後の階調値をそれぞれ示し、またs=L/lとし、Lはトレーニングサンプルであるグレースケール文字画像から得られた階調数を、Cはトレーニングサンプルであるグレースケール文字画像から得られた階調値の平均値を、lは前記認識されるグレースケール文字画像の階調数を、cは前記認識されるグレースケール文字画像の階調値の平均値を、それぞれ示す。
付記2に記載の方法において、
(付記4)
付記2に記載の方法において、
により、前記認識されるグレースケール文字画像の階調分布パラメータをトレーニングサンプルであるグレースケール文字画像から得られた階調分布パラメータに近似させ、ここで、xは認識されるグレースケール文字画像の画素の階調値を、a(x)は認識されるグレースケール文字画像の画素の変換後の階調値をそれぞれ示し、
ここで、gは平滑係数を、Lはトレーニングサンプルであるグレースケール文字画像から得られた階調数を、Cはトレーニングサンプルであるグレースケール文字画像から得られた階調値の平均値を、lは前記認識されるグレースケール文字画像の階調数を、cは前記認識されるグレースケール文字画像の階調値の平均値を、それぞれ示す。
付記2に記載の方法において、
(付記5)
付記1に記載の方法において、前記コンピュータが、階調分布パラメータ正規化処理を実施された、前記認識されるグレースケール文字画像の前景色と背景色との間の距離を拡大するダブルピーク補強処理を更に行う。
付記1に記載の方法において、前記コンピュータが、階調分布パラメータ正規化処理を実施された、前記認識されるグレースケール文字画像の前景色と背景色との間の距離を拡大するダブルピーク補強処理を更に行う。
(付記6)
付記5に記載の方法において、前記ダブルピーク補強処理では、階調分布パラメータ正規化処理が実施された、前記認識されるグレースケール文字画像の階調数が変わらないように維持される。
付記5に記載の方法において、前記ダブルピーク補強処理では、階調分布パラメータ正規化処理が実施された、前記認識されるグレースケール文字画像の階調数が変わらないように維持される。
(付記7)
付記6に記載の方法において、前記ダブルピーク補強処理では、次の関数を用いて、階調分布パラメータ正規化処理が実施された前記認識されるグレースケール文字画像の前景色と背景色との間の距離を拡大し、
ここで、lは認識されるグレースケール文字画像の階調数を、aは予め決められ、補強される強さを制御する因子をそれぞれ示す。
付記6に記載の方法において、前記ダブルピーク補強処理では、次の関数を用いて、階調分布パラメータ正規化処理が実施された前記認識されるグレースケール文字画像の前景色と背景色との間の距離を拡大し、
(付記8)
付記1に記載の方法において、前記コンピュータが、コンフォーマル正規化処理が実施されるグレースケール文字画像の画像エリアの背景色を推算する処理、前記コンフォーマル正規化が実施されるグレースケール文字画像に対してコンフォーマル変換を実施する処理、及び、前記コンフォーマル変換が実施されたグレースケール文字画像の空白エリアの色を前記画像エリアの背景色に設定する処理を含むコンフォーマル正規化処理を更に行う。
付記1に記載の方法において、前記コンピュータが、コンフォーマル正規化処理が実施されるグレースケール文字画像の画像エリアの背景色を推算する処理、前記コンフォーマル正規化が実施されるグレースケール文字画像に対してコンフォーマル変換を実施する処理、及び、前記コンフォーマル変換が実施されたグレースケール文字画像の空白エリアの色を前記画像エリアの背景色に設定する処理を含むコンフォーマル正規化処理を更に行う。
(付記9)
付記8に記載の方法において、前記コンフォーマル正規化処理は、前記コンフォーマル正規化が実施されるグレースケール文字画像の前景色と背景色との階調関係は、所望のグレースケール文字画像の前景色と背景色との階調関係とは反対になっているか否かを判定する反対色判定ステップと、前記コンフォーマル正規化が実施されるグレースケール文字画像の前景色と背景色との階調関係は、所望のグレースケール文字画像の前景色と背景色との階調関係とは反対になっている場合に、前記コンフォーマル正規化が実施されるグレースケール文字画像の階調を反転させることにより、前記コンフォーマル正規化が実施されるグレースケール文字画像の前景色と背景色との階調関係を、所望のグレースケール文字画像の前景色と背景色との階調関係と同じにする反対色修正ステップと、更にを含む。
付記8に記載の方法において、前記コンフォーマル正規化処理は、前記コンフォーマル正規化が実施されるグレースケール文字画像の前景色と背景色との階調関係は、所望のグレースケール文字画像の前景色と背景色との階調関係とは反対になっているか否かを判定する反対色判定ステップと、前記コンフォーマル正規化が実施されるグレースケール文字画像の前景色と背景色との階調関係は、所望のグレースケール文字画像の前景色と背景色との階調関係とは反対になっている場合に、前記コンフォーマル正規化が実施されるグレースケール文字画像の階調を反転させることにより、前記コンフォーマル正規化が実施されるグレースケール文字画像の前景色と背景色との階調関係を、所望のグレースケール文字画像の前景色と背景色との階調関係と同じにする反対色修正ステップと、更にを含む。
(付記10)
付記9に記載の方法において、前記反対色判定ステップでは、前記コンフォーマル正規化が実施されるグレースケール文字画像における画像エリアの境部画素の階調値の平均値を、前記コンフォーマル正規化が実施されるグレースケール文字画像の全エリアの階調値の平均値と比較し、所望のグレースケール文字画像の前景色と背景色との階調関係は背景色の階調値よりも前景色の方が大きい場合に、前記コンフォーマル正規化が実施されるグレースケール文字画像における画像エリアの境部画素の階調値の平均値は前記グレースケール文字画像の全エリアの階調値の平均値より大きければ、前記コンフォーマル正規化が実施されるグレースケール文字画像の前景色と背景色との階調関係は、所望のグレースケール文字画像の前景色と背景色との階調関係とは反対になっていると判定し、所望のグレースケール文字画像の前景色と背景色との階調関係は背景色の階調値よりも前景色の方が小さい場合に、前記コンフォーマル正規化が実施されるグレースケール文字画像における画像エリアの境部画素の階調値の平均値は前記コンフォーマル正規化が実施されるグレースケール文字画像の全画素の階調値の平均値より小さければ、前記コンフォーマル正規化が実施されるグレースケール文字画像の前景色と背景色との階調関係は、所望のグレースケール文字画像の前景色と背景色との階調関係とは反対になっていると判定する。
付記9に記載の方法において、前記反対色判定ステップでは、前記コンフォーマル正規化が実施されるグレースケール文字画像における画像エリアの境部画素の階調値の平均値を、前記コンフォーマル正規化が実施されるグレースケール文字画像の全エリアの階調値の平均値と比較し、所望のグレースケール文字画像の前景色と背景色との階調関係は背景色の階調値よりも前景色の方が大きい場合に、前記コンフォーマル正規化が実施されるグレースケール文字画像における画像エリアの境部画素の階調値の平均値は前記グレースケール文字画像の全エリアの階調値の平均値より大きければ、前記コンフォーマル正規化が実施されるグレースケール文字画像の前景色と背景色との階調関係は、所望のグレースケール文字画像の前景色と背景色との階調関係とは反対になっていると判定し、所望のグレースケール文字画像の前景色と背景色との階調関係は背景色の階調値よりも前景色の方が小さい場合に、前記コンフォーマル正規化が実施されるグレースケール文字画像における画像エリアの境部画素の階調値の平均値は前記コンフォーマル正規化が実施されるグレースケール文字画像の全画素の階調値の平均値より小さければ、前記コンフォーマル正規化が実施されるグレースケール文字画像の前景色と背景色との階調関係は、所望のグレースケール文字画像の前景色と背景色との階調関係とは反対になっていると判定する。
(付記11)
付記8に記載の方法において、前記コンフォーマル正規化が実施されるグレースケール文字画像における画像エリアの背景色を推算する処理では、所望のグレースケール文字画像の前景色と背景色との階調関係は背景色の階調値よりも前景色のほうが小さい場合、前記画像エリアの縁部画素の最も大きい階調値を前記背景色に設定する一方、所望のグレースケール文字画像の前景色と背景色との階調関係は背景色の階調値よりも前景色のほうが大きい場合、前記画像エリアの縁部画素の最も小さい階調値を前記背景色に設定する。
付記8に記載の方法において、前記コンフォーマル正規化が実施されるグレースケール文字画像における画像エリアの背景色を推算する処理では、所望のグレースケール文字画像の前景色と背景色との階調関係は背景色の階調値よりも前景色のほうが小さい場合、前記画像エリアの縁部画素の最も大きい階調値を前記背景色に設定する一方、所望のグレースケール文字画像の前景色と背景色との階調関係は背景色の階調値よりも前景色のほうが大きい場合、前記画像エリアの縁部画素の最も小さい階調値を前記背景色に設定する。
(付記12)
付記8に記載の方法において、前記コンフォーマル正規化が実施されるグレースケール文字画像における画像エリアの背景色を推算する処理では、前記画像エリアの縁部画素の平均諧調値を前記背景色に設定する。
付記8に記載の方法において、前記コンフォーマル正規化が実施されるグレースケール文字画像における画像エリアの背景色を推算する処理では、前記画像エリアの縁部画素の平均諧調値を前記背景色に設定する。
(付記13)
認識されるグレースケール文字画像の階調分布パラメータを取得する階調分布パラメータ取得手段と、前記認識されるグレースケール文字画像の階調分布パラメータをトレーニングサンプルであるグレースケール文字画像から得られた階調分布パラメータに近似させる階調分布パラメータ正規化手段と、を備えるグレースケール文字画像正規化装置。
認識されるグレースケール文字画像の階調分布パラメータを取得する階調分布パラメータ取得手段と、前記認識されるグレースケール文字画像の階調分布パラメータをトレーニングサンプルであるグレースケール文字画像から得られた階調分布パラメータに近似させる階調分布パラメータ正規化手段と、を備えるグレースケール文字画像正規化装置。
(付記14)
付記13に記載の装置において、前記認識されるグレースケール文字画像の階調分布パラメータは、前記認識されるグレースケール文字画像の階調数及びその諧調値の平均値である。
付記13に記載の装置において、前記認識されるグレースケール文字画像の階調分布パラメータは、前記認識されるグレースケール文字画像の階調数及びその諧調値の平均値である。
(付記15)
付記14に記載の装置において、
により、前記認識されるグレースケール文字画像の階調分布パラメータを、トレーニングサンプルであるグレースケール文字画像から得られた階調分布パラメータに近似させ、ここで、xは認識されるグレースケール文字画像の画素の階調値を、a(x)は認識されるグレースケール文字画像の画素の変換後の階調値をそれぞれ示し、またs=L/lとし、Lはトレーニングサンプルであるグレースケール文字画像から得られた階調数を、Cはトレーニングサンプルであるグレースケール文字画像から得られた諧調値の平均値を、lは前記認識されるグレースケール文字画像の階調数を、cは前記認識されるグレースケール文字画像の階調値の平均値を、それぞれ示す。
付記14に記載の装置において、
(付記16)
付記14に記載の装置において、
により、前記認識されるグレースケール文字画像の階調分布パラメータをトレーニングサンプルであるグレースケール文字画像から得られた階調分布パラメータに近似させ、ここで、xは認識されるグレースケール文字画像の画素の階調値を、a(x)は認識されるグレースケール文字画像の画素の変換後の階調値をそれぞれ示し、
ここで、gは平滑係数を、Lはトレーニングサンプルであるグレースケール文字画像から得られた階調数を、Cはトレーニングサンプルであるグレースケール文字画像から得られた諧調値の平均値を、lは前記認識されるグレースケール文字画像の階調数を、cは前記認識されるグレースケール文字画像の階調値の平均値を、それぞれ示す。
付記14に記載の装置において、
(付記17)
付記13に記載の装置において、階調分布パラメータ正規化手段で処理された前記認識されるグレースケール文字画像の前景色と背景色との間の距離を拡大するダブルピーク補強手段を更に備える。
付記13に記載の装置において、階調分布パラメータ正規化手段で処理された前記認識されるグレースケール文字画像の前景色と背景色との間の距離を拡大するダブルピーク補強手段を更に備える。
(付記18)
付記17に記載の装置において、前記ダブルピーク補強手段は、前記グレースケール分布パラメータ正規化手段で処理された前記認識されるグレースケール文字画像の階調数が変わらないように維持する。
付記17に記載の装置において、前記ダブルピーク補強手段は、前記グレースケール分布パラメータ正規化手段で処理された前記認識されるグレースケール文字画像の階調数が変わらないように維持する。
(付記19)
付記18に記載の装置において、前記ダブルピーク補強手段は、次の関数を用いて、前記グレースケール分布パラメータ正規化手段で処理された前記認識されるグレースケール文字画像の前景色と背景色との間の距離を拡大し、
ここで、lは認識されるグレースケール文字画像の階調数を、aは予め決められ、補強される強さを制御する因子をそれぞれ示す。
付記18に記載の装置において、前記ダブルピーク補強手段は、次の関数を用いて、前記グレースケール分布パラメータ正規化手段で処理された前記認識されるグレースケール文字画像の前景色と背景色との間の距離を拡大し、
(付記20)
付記13に記載の装置において、コンフォーマル正規化処理が実施されるグレースケール文字画像の画像エリアの背景色を推算する背景色推算手段と、前記コンフォーマル正規化が実施されるグレースケール文字画像に対してコンフォーマル変換を実施するコンフォーマル変換手段と、前記コンフォーマル変換が実施されたグレースケール文字画像の空白エリアの色を前記画像エリアの背景色に設定する背景色充填手段と、を有するコンフォーマル正規化手段を更に備える。
付記13に記載の装置において、コンフォーマル正規化処理が実施されるグレースケール文字画像の画像エリアの背景色を推算する背景色推算手段と、前記コンフォーマル正規化が実施されるグレースケール文字画像に対してコンフォーマル変換を実施するコンフォーマル変換手段と、前記コンフォーマル変換が実施されたグレースケール文字画像の空白エリアの色を前記画像エリアの背景色に設定する背景色充填手段と、を有するコンフォーマル正規化手段を更に備える。
(付記21)
付記20に記載の装置において、前記コンフォーマル正規化手段は、前記コンフォーマル正規化が実施されるグレースケール文字画像の前景色と背景色との階調関係は、所望のグレースケール文字画像の前景色と背景色との階調関係とは反対になっているか否かを判定する反対色判定手段と、前記コンフォーマル正規化が実施されるグレースケール文字画像の前景色と背景色との階調関係は、所望のグレースケール文字画像の前景色と背景色との階調関係とは反対になっている場合に、前記コンフォーマル正規化が実施されるグレースケール文字画像の階調を反転させることにより、前記コンフォーマル正規化が実施されるグレースケール文字画像の前景色と背景色との階調関係を、所望のグレースケール文字画像の前景色と背景色との階調関係と同じにする反対色修正手段とを更に備える。
付記20に記載の装置において、前記コンフォーマル正規化手段は、前記コンフォーマル正規化が実施されるグレースケール文字画像の前景色と背景色との階調関係は、所望のグレースケール文字画像の前景色と背景色との階調関係とは反対になっているか否かを判定する反対色判定手段と、前記コンフォーマル正規化が実施されるグレースケール文字画像の前景色と背景色との階調関係は、所望のグレースケール文字画像の前景色と背景色との階調関係とは反対になっている場合に、前記コンフォーマル正規化が実施されるグレースケール文字画像の階調を反転させることにより、前記コンフォーマル正規化が実施されるグレースケール文字画像の前景色と背景色との階調関係を、所望のグレースケール文字画像の前景色と背景色との階調関係と同じにする反対色修正手段とを更に備える。
(付記22)
付記21に記載の装置において、前記反対色判定手段は、前記コンフォーマル正規化が実施されるグレースケール文字画像における画像エリアの境部画素の諧調値の平均値を、前記コンフォーマル正規化が実施されるグレースケール文字画像の全エリアの諧調値の平均値と比較し、所望のグレースケール文字画像の前景色と背景色との階調関係は背景色の階調値よりも前景色の方が大きい場合に、前記コンフォーマル正規化が実施されるグレースケール文字画像における画像エリアの境部画素の階調値の平均値は前記グレースケール文字画像の全エリアの階調値の平均値より大きければ、前記コンフォーマル正規化が実施されるグレースケール文字画像の前景色と背景色との階調関係は、所望のグレースケール文字画像の前景色と背景色との階調関係とは反対になっていると判定し、
所望のグレースケール文字画像の前景色と背景色との階調関係は背景色の階調値よりも前景色の方が小さい場合に、前記コンフォーマル正規化が実施されるグレースケール文字画像における画像エリアの境部画素の階調値の平均値は前記コンフォーマル正規化が実施されるグレースケール文字画像の全画素の階調値の平均値より小さければ、前記コンフォーマル正規化が実施されるグレースケール文字画像の前景色と背景色との階調関係は、所望のグレースケール文字画像の前景色と背景色との階調関係とは反対になっていると判定する。
付記21に記載の装置において、前記反対色判定手段は、前記コンフォーマル正規化が実施されるグレースケール文字画像における画像エリアの境部画素の諧調値の平均値を、前記コンフォーマル正規化が実施されるグレースケール文字画像の全エリアの諧調値の平均値と比較し、所望のグレースケール文字画像の前景色と背景色との階調関係は背景色の階調値よりも前景色の方が大きい場合に、前記コンフォーマル正規化が実施されるグレースケール文字画像における画像エリアの境部画素の階調値の平均値は前記グレースケール文字画像の全エリアの階調値の平均値より大きければ、前記コンフォーマル正規化が実施されるグレースケール文字画像の前景色と背景色との階調関係は、所望のグレースケール文字画像の前景色と背景色との階調関係とは反対になっていると判定し、
所望のグレースケール文字画像の前景色と背景色との階調関係は背景色の階調値よりも前景色の方が小さい場合に、前記コンフォーマル正規化が実施されるグレースケール文字画像における画像エリアの境部画素の階調値の平均値は前記コンフォーマル正規化が実施されるグレースケール文字画像の全画素の階調値の平均値より小さければ、前記コンフォーマル正規化が実施されるグレースケール文字画像の前景色と背景色との階調関係は、所望のグレースケール文字画像の前景色と背景色との階調関係とは反対になっていると判定する。
(付記23)
付記20に記載の装置において、前記背景色推算手段は、所望のグレースケール文字画像の前景色と背景色との階調関係は背景色の階調値よりも前景色のほうが小さい場合、前記画像エリアの縁部画素の最も大きい階調値を前記背景色に設定する一方、所望のグレースケール文字画像の前景色と背景色との階調関係は背景色の階調値よりも前景色のほうが大きい場合、前記画像エリアの縁部画素の最も小さい階調値を前記背景色に設定する。
付記20に記載の装置において、前記背景色推算手段は、所望のグレースケール文字画像の前景色と背景色との階調関係は背景色の階調値よりも前景色のほうが小さい場合、前記画像エリアの縁部画素の最も大きい階調値を前記背景色に設定する一方、所望のグレースケール文字画像の前景色と背景色との階調関係は背景色の階調値よりも前景色のほうが大きい場合、前記画像エリアの縁部画素の最も小さい階調値を前記背景色に設定する。
(付記24)
付記20に記載の装置において、前記背景色推算手段は、前記画像エリアの縁部画素の平均諧調値を前記背景色に設定する。
付記20に記載の装置において、前記背景色推算手段は、前記画像エリアの縁部画素の平均諧調値を前記背景色に設定する。
(付記25)
付記1−12のいずれか一つに記載の方法を含む文字認識方法。
付記1−12のいずれか一つに記載の方法を含む文字認識方法。
(付記26)
付記25に記載の方法において、畳み込みニューラルネットワーク分類器を用いて、グレースケール文字画像に対して階調分布正規化処理及びコンフォーマル正規化処理が実施された後の文字認識を行う処理を更に含む。
付記25に記載の方法において、畳み込みニューラルネットワーク分類器を用いて、グレースケール文字画像に対して階調分布正規化処理及びコンフォーマル正規化処理が実施された後の文字認識を行う処理を更に含む。
(付記27)
コンピュータに、付記1−12のいずれか一つに記載のグレースケール文字画像正規化方法を実行させるためのプログラム。
コンピュータに、付記1−12のいずれか一つに記載のグレースケール文字画像正規化方法を実行させるためのプログラム。
(付記28)
付記27に記載のプログラムを記憶するコンピュータ読み取り可能な記憶媒体。
付記27に記載のプログラムを記憶するコンピュータ読み取り可能な記憶媒体。
Claims (10)
- コンピュータが、
認識されるグレースケール文字画像の階調分布パラメータを取得する階調分布パラメータ取得処理、及び
前記認識されるグレースケール文字画像の階調分布パラメータを、トレーニングサンプルであるグレースケール文字画像から得られた階調分布パラメータに近似させる階調分布パラメータ正規化処理を行う、グレースケール文字画像正規化方法。 -
ここで、xは前記認識されるグレースケール文字画像の画素の階調値を、a(x)は前記認識されるグレースケール文字画像の画素の変換後の階調値をそれぞれ示し、またs=L/lとし、Lは前記トレーニングサンプルであるグレースケール文字画像から得られた階調数を、Cは前記トレーニングサンプルであるグレースケール文字画像から得られた階調値の平均値を、lは前記認識されるグレースケール文字画像の階調数を、cは前記認識されるグレースケール文字画像の階調値の平均値をそれぞれ示す、請求項1に記載のグレースケール文字画像正規化方法。 -
ここで、xは前記認識されるグレースケール文字画像の画素の階調値を、a(x)は前記認識されるグレースケール文字画像の画素の変換後の階調値をそれぞれ示し、
- 前記コンピュータが、さらに、
前記階調分布パラメータ正規化処理が実施された後の前記認識されるグレースケール文字画像の前景色と背景色との間の距離を拡大するダブルピーク補強処理を行う、請求項1に記載のグレースケール文字画像正規化方法。 - 前記コンピュータが、さらに、コンフォーマル正規化処理を行い、
前記コンフォーマル正規化処理は、
前記コンフォーマル正規化処理が実施される前記グレースケール文字画像の画像エリアの背景色を推算するステップと、
前記コンフォーマル正規化処理が実施される前記グレースケール文字画像に対してコンフォーマル変換を実施するステップと、
前記コンフォーマル変換が実施された前記グレースケール文字画像の空白エリアの色を前記画像エリアの背景色に設定するステップと、を含む、請求項1に記載のグレースケール文字画像正規化方法。 - 前記コンフォーマル正規化処理は、さらに、
前記コンフォーマル正規化が実施される前記グレースケール文字画像の前景色と背景色との階調関係と、所望のグレースケール文字画像の前景色と背景色との階調関係とは反対になっているか否かを判定する反対色判定ステップと、
前記コンフォーマル正規化が実施される前記グレースケール文字画像の前景色と背景色との階調関係と、前記所望のグレースケール文字画像の前景色と背景色との階調関係とは反対になっている場合に、前記コンフォーマル正規化が実施される前記グレースケール文字画像の階調を反転させることにより、前記コンフォーマル正規化が実施される前記グレースケール文字画像の前景色と背景色との階調関係を、前記所望のグレースケール文字画像の前景色と背景色との階調関係と同じにする反対色修正ステップと、を含む、請求項5に記載のグレースケール文字画像正規化方法。 - 前記反対色判定ステップでは、
前記コンフォーマル正規化が実施される前記グレースケール文字画像における画像エリアの縁部画素の階調値の平均値と、前記コンフォーマル正規化が実施される前記グレースケール文字画像の全エリアの階調値の平均値とを比較し、
前記所望のグレースケール文字画像の前景色と背景色との階調関係は背景色の階調値よりも前景色の方が大きい場合に、前記コンフォーマル正規化が実施される前記グレースケール文字画像における画像エリアの縁部画素の階調値の平均値は前記グレースケール文字画像の全エリアの階調値の平均値より大きければ、前記コンフォーマル正規化が実施される前記グレースケール文字画像の前景色と背景色との階調関係は、前記所望のグレースケール文字画像の前景色と背景色との階調関係とは反対になっていると判定し、
前記所望のグレースケール文字画像の前景色と背景色との階調関係は背景色の階調値よりも前景色の方が小さい場合に、前記コンフォーマル正規化が実施される前記グレースケール文字画像における画像エリアの縁部画素の階調値の平均値は前記コンフォーマル正規化が実施される前記グレースケール文字画像の全画素の階調値の平均値より小さければ、前記コンフォーマル正規化が実施される前記グレースケール文字画像の前景色と背景色との階調関係は、前記所望のグレースケール文字画像の前景色と背景色との階調関係とは反対になっていると判定する、請求項6に記載のグレースケール文字画像正規化方法。 - 前記コンフォーマル正規化が実施される前記グレースケール文字画像における画像エリアの背景色を推算するステップでは、
前記所望のグレースケール文字画像の前景色と背景色との階調関係は背景色の階調値よりも前景色のほうが小さい場合、前記画像エリアの縁部画素の最も大きい階調値を前記背景色に設定する一方、前記所望のグレースケール文字画像の前景色と背景色との階調関係は背景色の階調値よりも前景色のほうが大きい場合、前記画像エリアの縁部画素の最も小さい階調値を前記背景色に設定する、請求項5に記載のグレースケール文字画像正規化方法。 - 前記コンフォーマル正規化が実施される前記グレースケール文字画像における画像エリアの背景色を推算するステップでは、
前記画像エリアの縁部画素の平均階調値を前記背景色に設定する、請求項5に記載のグレースケール文字画像正規化方法。 - 認識されるグレースケール文字画像の階調分布パラメータを取得する階調分布パラメータ取得手段と、
前記認識されるグレースケール文字画像の階調分布パラメータを、トレーニングサンプルである階調文字画像から得られた諧調分布パラメータに近似させる諧調分布パラメータ正規化手段と、を含む、グレースケール文字画像正規化装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110191181.7 | 2011-07-08 | ||
CN2011101911817A CN102867180A (zh) | 2011-07-08 | 2011-07-08 | 灰度字符图像归一化装置和灰度字符图像归一化方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2013020617A true JP2013020617A (ja) | 2013-01-31 |
Family
ID=47446044
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012152525A Pending JP2013020617A (ja) | 2011-07-08 | 2012-07-06 | グレースケール文字画像正規化装置及び方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP2013020617A (ja) |
CN (1) | CN102867180A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111583247A (zh) * | 2020-05-12 | 2020-08-25 | 中南大学 | 一种图像二值化处理方法及装置 |
CN113111921A (zh) * | 2021-03-19 | 2021-07-13 | 中建科技集团有限公司 | 物体识别方法、装置、电子设备及存储介质 |
US11423728B2 (en) | 2018-10-24 | 2022-08-23 | Fujitsu Frontech Limited | Banknote inspection device, banknote inspection method, and banknote inspection program product |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107025452A (zh) * | 2016-01-29 | 2017-08-08 | 富士通株式会社 | 图像识别方法和图像识别设备 |
CN108288064B (zh) * | 2017-01-09 | 2022-06-07 | 北京京东尚科信息技术有限公司 | 用于生成图片的方法和装置 |
CN107403176B (zh) * | 2017-03-29 | 2020-02-28 | 北京猿力未来科技有限公司 | 文本图片中文字背景反色的检测方法和装置 |
CN108229463A (zh) * | 2018-02-07 | 2018-06-29 | 众安信息技术服务有限公司 | 基于图像的文字识别方法 |
CN109784342B (zh) * | 2019-01-24 | 2021-03-12 | 厦门商集网络科技有限责任公司 | 一种基于深度学习模型的ocr识别方法及终端 |
CN110363195A (zh) * | 2019-06-18 | 2019-10-22 | 深圳壹账通智能科技有限公司 | 图形验证码识别方法、装置、可读存储介质及终端设备 |
CN111161247B (zh) * | 2019-12-30 | 2023-10-20 | 凌云光技术股份有限公司 | 用于可变码识读字符质量验证的检测方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4479178B2 (ja) * | 2003-07-31 | 2010-06-09 | セイコーエプソン株式会社 | 画像処理装置、画像処理方法及びプログラム |
JP2007522732A (ja) * | 2004-02-03 | 2007-08-09 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | スクリーンに表示される画像のアスペクト比の変更 |
-
2011
- 2011-07-08 CN CN2011101911817A patent/CN102867180A/zh active Pending
-
2012
- 2012-07-06 JP JP2012152525A patent/JP2013020617A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11423728B2 (en) | 2018-10-24 | 2022-08-23 | Fujitsu Frontech Limited | Banknote inspection device, banknote inspection method, and banknote inspection program product |
CN111583247A (zh) * | 2020-05-12 | 2020-08-25 | 中南大学 | 一种图像二值化处理方法及装置 |
CN111583247B (zh) * | 2020-05-12 | 2023-11-03 | 中南大学 | 一种图像二值化处理方法及装置 |
CN113111921A (zh) * | 2021-03-19 | 2021-07-13 | 中建科技集团有限公司 | 物体识别方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN102867180A (zh) | 2013-01-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2013020617A (ja) | グレースケール文字画像正規化装置及び方法 | |
KR102146560B1 (ko) | 영상 보정 방법 및 장치 | |
JP3505115B2 (ja) | 画像加工装置及びプログラム記録媒体 | |
WO2017121018A1 (zh) | 二维码图像处理的方法和装置、终端、存储介质 | |
JP5124036B2 (ja) | 輝度変換曲線作成装置および方法,ならび輝度変換曲線作成プログラム | |
EP3272110B1 (en) | Apparatus and method for color calibration | |
US8369648B2 (en) | Image correction apparatus and image correction method | |
JP2004320701A (ja) | 画像処理装置、画像処理プログラムおよび記憶媒体 | |
CN108805829B (zh) | 影像数据处理方法、装置、设备及计算机可读存储介质 | |
Arriaga-Garcia et al. | Adaptive sigmoid function bihistogram equalization for image contrast enhancement | |
JP2004166007A (ja) | 画像処理装置及び画像処理方法、画像処理プログラム、記憶媒体 | |
US10348932B2 (en) | Image processing apparatus, method of controlling the same, and non-transitory computer-readable storage medium that decrease the lightness of pixels, except for a highlight region, based on a generated lightness histogram | |
JP5152203B2 (ja) | 画像処理装置、画像処理方法、画像処理プログラムおよび画像補正装置 | |
JP4093413B2 (ja) | 画像処理装置、画像処理プログラム及び該プログラムを記録した記録媒体 | |
JP5859749B2 (ja) | ベジェ曲線を利用したコントラスト改善方法 | |
JP6771134B2 (ja) | 画像補正方法及び画像補正装置 | |
JP4536015B2 (ja) | 輝度変換曲線作成装置および方法,ならび輝度変換曲線作成プログラム | |
US20120275691A1 (en) | Coefficient learning device and method, image processing device and method, program, and recording medium | |
JP6370080B2 (ja) | 画像処理装置、画像処理方法及びプログラム。 | |
KR102547864B1 (ko) | 콘크리트 결함 평가 방법 및 이를 수행하는 컴퓨팅 장치 | |
US20190259168A1 (en) | Image processing apparatus, image processing method, and storage medium | |
JP4708866B2 (ja) | ルックアップテーブル作成装置および方法,ならびにルックアップテーブル作成プログラム | |
JP2001222683A (ja) | 画像処理方法、画像処理装置、文字認識方法、文字認識装置及び記憶媒体 | |
JP2013250314A (ja) | 画像処理装置、表示装置、情報処理装置および画像処理方法 | |
JP5447614B2 (ja) | 画像処理装置および画像処理プログラム |