JP2014164320A - 文字認識装置および文字認識方法 - Google Patents

文字認識装置および文字認識方法 Download PDF

Info

Publication number
JP2014164320A
JP2014164320A JP2013031992A JP2013031992A JP2014164320A JP 2014164320 A JP2014164320 A JP 2014164320A JP 2013031992 A JP2013031992 A JP 2013031992A JP 2013031992 A JP2013031992 A JP 2013031992A JP 2014164320 A JP2014164320 A JP 2014164320A
Authority
JP
Japan
Prior art keywords
area
character string
region
energy function
character recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013031992A
Other languages
English (en)
Other versions
JP6076128B2 (ja
Inventor
Yusuke Itani
裕介 伊谷
Takashi Hirano
敬 平野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2013031992A priority Critical patent/JP6076128B2/ja
Publication of JP2014164320A publication Critical patent/JP2014164320A/ja
Application granted granted Critical
Publication of JP6076128B2 publication Critical patent/JP6076128B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

【課題】余白および罫線などの検出誤りがある場合、ならびに、画像内に特性の異なる文字が存在する場合でも、高精度に文字列を抽出できる文字認識装置および文字認識方法を提供する。
【解決手段】領域検出部3が、画像データから罫線および空白などで囲まれた領域を検出する。文字列抽出部4が、領域内からラベルを検出し、ラベルからの距離に応じて重みづけしたエネルギ関数を生成し、領域内の最適化処理によりラベルを統合する。文字認識部5は、統合されたラベル内の文字列を認識処理する。
【選択図】図1

Description

この発明は、画像データの中から文字を認識する文字認識装置および文字認識方法に関するものである。
従来の文字認識装置は、主に、二値化処理部、余白検出部、文字列抽出部、および文字認識部から構成されていた。先ず、二値化処理部が画像データの二値化処理を行う。続いて、余白検出部が、二値化後の画像に対して余白の検出を行い、非余白領域を抽出する。続いて、文字列抽出部が、非余白領域において黒画素の連結状態を調べ、黒画素が連結しているかたまりをラベルにし、各ラベルを統合して文字列の領域を決定する。最後に、文字認識部が、統合したラベルの文字認識を行い、認識結果を出力する。
ラベル統合方法として、例えば特許文献1ではラベルの膨張処理を行い、膨張させたラベルが重なった場合、重なったラベルを統合するという手法が開示されている。この際、膨張結果が罫線を超えないような制御がされている。
また、特許文献2では、周囲のラベルを探索し、ラベル間の距離に応じて統合するかどうかを決定する手法が開示されている。
特開2009−141597号公報 特開2007−26470号公報
従来の文字認識装置は以上のように構成されているので、ラベル生成前の余白および罫線などの非余白領域の検出結果に基づき、余白および罫線などを超えないようなラベル統合を行っていた。しかし、余白および罫線などの検出は、画像のノイズ成分およびレイアウト構成などに影響を受けて検出誤りが起きることがある。そのため、検出誤りが起きた場合に、ラベルの統合がうまくいかず、文字列抽出に失敗するという課題があった。
また、統合する際の膨張範囲は画像の大きさなどに応じて決定され、画像ごとに固定であるため、画像の局所性に対応できないという課題があった。
この発明は、上記のような課題を解決するためになされたもので、余白および罫線などの検出誤りがある場合、ならびに、画像内に特性の異なる文字が存在する場合でも、高精度に文字列を抽出できる文字認識装置および文字認識方法を提供することを目的とする。
この発明に係る文字認識装置は、領域内から非余白領域を検出するラベル検出部と、ラベル検出部の検出した非余白領域からの距離に応じて重みづけしたエネルギ関数を生成する統合エネルギ関数生成部と、統合エネルギ関数生成部の生成したエネルギ関数に基づく最適化関数を用いて最適化処理を行い、最適化結果に従って領域内の非余白領域を統合して文字列として抽出する最適化処理部とを有するものである。
この発明に係る文字認識方法は、領域内から非余白領域を検出するラベル検出ステップと、ラベル検出ステップで検出した非余白領域からの距離に応じて重みづけしたエネルギ関数を生成する統合エネルギ関数生成ステップと、統合エネルギ関数生成ステップで生成したエネルギ関数に基づく最適化関数を用いて最適化処理を行い、最適化結果に従って領域内の非余白領域を統合して文字列として抽出する最適化処理ステップとを有するものである。
この発明によれば、領域内の最適化処理により非余白領域(即ち、ラベル)を統合するようにしたので、余白および罫線などの検出誤りがある場合、ならびに、画像内に特性の異なる文字が存在する場合でも、高精度に文字列を抽出でき、文字認識精度を向上させた文字認識装置を提供することができる。
この発明によれば、領域内の最適化処理により非余白領域(即ち、ラベル)を統合するようにしたので、余白および罫線などの検出誤りがある場合、ならびに、画像内に特性の異なる文字が存在する場合でも、高精度に文字列を抽出でき、文字認識精度を向上させた文字認識方法を提供することができる。
この発明の実施の形態1に係る文字認識装置の構成を示すブロック図である。 実施の形態1に係る文字認識装置の領域検出部が検出する領域の例を示す図である。 領域の別の例を示す図である。 実施の形態1に係る文字認識装置の領域検出部の動作を示すフローチャートである。 実施の形態1に係る文字認識装置の文字列抽出部の内部構成を示すブロック図である。 実施の形態1に係る文字認識装置の統合エネルギ関数生成部が生成するエネルギ関数の一例を説明する図である。 エネルギ関数の別の例を説明する図であり、エネルギ関数が重なる場合を示す。 エネルギ関数の別の例を説明する図であり、罫線が存在する場合を示す。 実施の形態1に係る文字認識装置の文字列抽出部の動作を示すフローチャートである。 実施の形態1に係る文字認識装置の最適化処理部による最適化処理を説明する図である。 実施の形態1に係る文字認識装置の複数のエネルギ関数の例を説明する図である。 実施の形態1に係る文字認識装置において、複数のエネルギ関数を用いた場合の統合結果の決定方法を説明する図である。 実施の形態1に係る文字認識装置の重み定数のテーブルの例を示す図である。 図13に示すテーブルの重み定数に基づいて作成されたエネルギ関数を示す図である。 実施の形態1に係る文字認識装置においてグレースケール画像から領域を検出する例を説明する図である。
実施の形態1.
図1に示すように、本実施の形態1に係る文字認識装置1は、二値化処理部2と、領域検出部3と、文字列抽出部4と、文字認識部5とから構成される。これら二値化処理部2、領域検出部3、文字列抽出部4および文字認識部5を各種電子回路でハードウェアとして構成してもよいし、文字認識装置1をコンピュータで構成して、CPUを二値化処理部2、領域検出部3、文字列抽出部4および文字認識部5として機能させるためのプログラムをメモリ等に格納し、CPUがそのプログラムを実行するようにしてもよい。
この文字認識装置1において、先ず、画像データが二値化処理部2に入力されると、二値化処理部2が画像データの二値化処理を行い、二値化処理後の画像データ(以下、二値画像データ)を領域検出部3、文字列抽出部4および文字認識部5に出力する。
以下の説明では、画像データの余白(背景など)が二値化処理によって白画素に変換され、余白以外(文字、罫線、シンボル図形など)が黒画素に変換されたものとする。
領域検出部3は、二値画像データから文字列抽出対象となる領域を検出し、領域検出結果を文字列抽出部4へ出力する。領域検出部3の検出する領域は、何かしらの線で閉じられた領域と定義する。
文字列抽出部4は、二値化処理部2の二値画像データと領域検出部3の領域検出結果を用いて文字列を抽出し、文字列抽出結果を文字認識部5に出力する。文字認識部5は、二値化処理部2の二値画像データと文字列抽出部4の文字列抽出結果を用いて文字認識処理を行い、文字認識結果を出力する。
ここで、図2および図3に、領域検出部3が検出する領域の例を示す。例えば、図2(a)に示すように、罫線で囲まれた部分(即ち、連続する黒画素で閉じられた領域)をそれぞれ領域#1〜#3としてもよいし、図2(b)に示すように、空白で囲まれた部分(即ち、連続する白画素で閉じられた領域)をそれぞれ領域#1〜#9としてもよい。また、画像中の特定の形状のシンボルを検出し、そのシンボルの特定部分を領域#1としてもよい。図2(c)の例では、円形の図形をシンボルとして検出し、円の内側を領域#1として検出している。
また、図3(a)に示すように、大きい領域#1の中に小さい領域#2が存在する可能性がある。この場合、領域検出部3は、小さい領域#2を領域として検出しないことで、後工程を二重に行わず、処理を削減できる。
あるいは、領域#1,#2を両方とも領域として検出してもよい。この場合、領域の分割数は増えるが、より局所性を考慮した処理が可能となる。また、図3(b)のように、領域を階層化(領域a,b)する場合が考えられる。階層化することで、データ構造は複雑になるが後工程の処理を増やさずに領域の局所性を考慮した処理が可能となる。
また、領域内に領域が存在するパターンとして、図3(c)に示すように、画像が罫線などによって複数の領域#1〜#3に区切られている場合も考えられる。この場合、領域検出部3は、区切られた1つ1つを領域#1〜#3として検出し、大枠の領域#4は領域から外すことで、画像の局所性に対応することが可能となる。
なお、領域検出部3は、上位で明示的にシグナリングされた指示に従って領域#2,#4の検出可否を決定してもよいし、領域検出部3に検出可否を判断する閾値を設定しておき、領域#2,#4の面積が閾値以下の場合は検出しない等の判断処理を行ってもよい。
図4は、領域検出部3の動作を示すフローチャートである。領域検出部3は、先ず、罫線、空白、シンボルといった、領域決定に必要な要素を二値画像データから検出する(ステップST1)。罫線検出および空白検出の手法は、例えば下記参考文献1の手法が、シンボル検出には下記参考文献2の手法が考えられる。
参考文献1:平野敬、岡田康裕、依田文夫、“文書画像からの罫線抽出方式”、電子情報通信学会総合大会、1998年3月
参考文献2:米山昇吾、平野敬、岡田康裕、“図面画像内シンボル抽出方式の検討”、電子情報通信学会総合大会、2006年3月
領域検出部3は、要素抽出後、領域候補を抽出する(ステップST2)。図2に示したように、罫線で囲まれた領域、空白で囲まれた領域、またはシンボルの特定領域を候補とする。続いて領域検出部3は、抽出した領域候補から、図3に示したような領域の重なりを考慮し、最終的な領域を決定する(ステップST3)。
次に、本発明のポイントである文字列抽出部4の詳細を説明する。
図5は、文字列抽出部4の内部構成を示すブロック図である。文字列抽出部4において、先ず、二値化処理部2の二値画像データと領域検出部3の領域検出結果をラベル検出部41に入力する。ラベル検出部41は、二値画像データの対象領域において黒画素のかたまりを検出してラベルを生成する。ラベル検出部41のラベル検出は従来技術と同様の処理を行えばよいため説明は割愛する。
統合エネルギ関数生成部42は、ラベル検出部41の検出したラベルに基づいて、領域を統合するために用いるエネルギ関数を生成する。
図6は、統合エネルギ関数生成部42の生成するエネルギ関数を説明する図であり、二値画像データの領域#1においてラベル#1とその周辺部分に付与された重みのうち、画素列Aの各画素に付与された重みを、一次元のグラフとして示す。グラフの縦軸が重み、横軸が画素位置である。重みは、ラベルの統合される確率を示しており、重みが大きいほど統合確率が高いことを示す。そのため、すでにラベルが検出された領域(図中のラベル#1)は統合確率が高い。一般的に、ラベル間の距離が近いほど同じ文字列である確率が高く、離れるほど低くなる。そのため、重みはラベルからの距離に応じた関数とする。図中では、重みが大きいほど濃い色で表す。
各ラベルからの距離に応じた重みを考えた場合、図7のようにラベル#1,#2の距離が近く、ラベル#1のエネルギ関数とラベル#2のエネルギ関数が重なる場合が考えられる。この場合、重なった領域においてラベル#1の重みα1とラベル#2の重みα2を加算することが考えられる。
また、領域検出部3が罫線および空白などの検出に失敗した場合などには、図8(a)のように、領域内であるにもかかわらずラベル#1とラベル#2の間に罫線(または空白)が存在する可能性がある。この場合、罫線はラベルに統合されない可能性が高いため、重みを下げることが考えられる。
罫線が存在する場合に重みを小さくする方法は、下式(1)で示すように重みαから重み定数βを減算してもよいし、下式(2)で示すように重みαに重み定数λを乗算してもよい。
重み(罫線)=α−β (1)
重み(罫線)=α×λ (2)
これにより、図8(b)に示すように罫線の重みが下がり、後工程において罫線がラベルに統合されにくくなる。
最適化処理部43は、統合エネルギ関数生成部42で作成されたエネルギ関数から、予め定義された最適化関数を元に最適化処理を行ってラベルを統合し、統合した結果を文字列抽出結果とする。
最適化関数Fとしては、例えば下式(3)が考えられる。
Figure 2014164320
ここで、Length(C)は境界Cの周囲長を、(x,y)は座標を、u(x,y)は座標(x,y)におけるエネルギを示す。cは境界Cの内側におけるエネルギの平均値を、cは外側の平均値を示す。φ(x,y)は境界Cのエネルギを0としたときの、(x,y)の相対値を示す。H(φ)は抽出結果の内側かどうかを示すものとし、上記式で定義される。μ,λ,λは各パラメータの重みを示す。
上式(3)の最適化関数Fの第一項は、領域の周囲長を示しており、領域を細かく分割するよりも統合したほうが周囲長は短くなる性質がある。一方、第二項、第三項は、領域内の分散を示しており、領域を分割して細かい単位で計算することで分散が小さくなる性質がある。周囲長と分散を組み合わせることで、統合と分割のバランスをとる効果がある。
図9は、文字列抽出部4の動作を示すフローチャートである。文字列抽出部4は、領域検出部3の検出した領域ごとに処理を行う。
先ず、ラベル検出部41が、領域内の黒画素を検出し(ステップST11)、検出した黒画素を連結させる(ステップST12)。黒画素の連結処理は、例えば処理対象の黒画素の周囲8方向を見て、黒画素が存在している場合は連結し、そうでない場合は連結しない処理が考えられる。黒画素の連結後、連結した黒画素を囲むような矩形領域をラベルとして生成する(ステップST13)。
ラベル生成後、統合エネルギ関数生成部42がエネルギ関数Eの生成を行う(ステップST14)。エネルギ関数は、ラベルからの距離に応じて、下式(4)のような関数で示される。
E(x,y)=M−λmax(|(x0−x)|,|(y0−y)|) (4)
ここで、(x0,y0)はラベルの位置を示し、λは重み定数を示す。Mは重みの上限値とする。
E(x,y)は、罫線および空白による重みをつけることが可能である。この場合、式(5)のような関数で表せる。
E(x,y)=M−λmax(|x0−x)|,|(y0−y)|)
−β×φ(x,y) (5)
ここで、φ(x,y)は座標(x,y)における罫線および空白の存在有無を示し、βは罫線および空白にかかる重み定数を示す。
エネルギ関数生成後、最適化処理部43がエネルギ関数の最適化処理を行い(即ち、上式(3)を最小化するような値を求め)、最適化結果に従って領域内のラベルを統合し、文字列を抽出する(ステップST15)。二値画像データから検出された領域が他にも存在する場合は(ステップST16“NO”)、ステップST11に戻り、次の領域の処理に移る。二値画像データから検出された全ての領域について処理を終えると(ステップST16“NO”)、文字列抽出部4の一連の処理を終了する。
図10に、最適化処理部43の最適化処理を説明する図を示す。この図10では、図6に示した二値画像データの領域#1において、ラベル#1の画素列Aのエネルギ関数Eを、一次元のグラフとして示す。グラフの縦軸がエネルギ関数Eの値、横軸が画素位置である。図10のグラフに示すように、E(x,y)を閾値Thでみた断面を考え、ThよりもE(x,y)が大きい画素を内側(文字列)、小さい画素を外側と定義する。最適化処理部43は、Thを移動させ、最適化関数F(c,u0)が最小となる閾値Thを求める。
なお、最適化処理部43が最適な閾値Thを求める際、Eの取り得るすべての値で反復処理を行ってもよいし、F(c,u0)がある一定の値を下回るまで繰り返し処理を行ってもよい。
Figure 2014164320
文字列抽出部4の文字列抽出後、文字認識部5が文字列の文字認識処理を行う。文字認識の手法は、例えば下記参考文献3の手法が考えられる。
参考文献3:森稔、澤木美奈子、萩田紀博、村瀬洋、武川直樹、“ランレングス補正を用いた画像劣化にロバストな特徴抽出”、電子情報通信学会論文誌、Vol.J86−D2、No.7、pp.1049−1057、2003年7月
このように、罫線および空白を0ではなく、ある重みに基づくエネルギ関数Eとして評価するようにしたので、領域内に存在する罫線および空白をまたいでラベルを統合することができる。そのため、仮に罫線および空白などの検出に失敗したとしても、Eの最適化処理により、文字領域を正しく検出することができる。
なお、上記例のエネルギ関数は、図6等に示したようにラベルからの距離に応じて直線状に重み付けしたが、これに限定されるものではなく、例えばガウスフィルタなどを用い、正規分布として表現してもよい。この場合、文字列抽出部4の処理量は増えるが、確率分布として適切な分布となるため、統合精度の向上に寄与する。
ちなみに、ガウスフィルタは下式(6)で表せる。
Figure 2014164320
また、上記例では、1つのラベルに1つのエネルギ関数を生成したが、これに限定されるものではなく、統合エネルギ関数生成部42が1つのラベルに複数のエネルギ関数を生成し、最適化処理部43が各エネルギ関数について反復計算を行い、反復計算結果を照合して最適な統合を探してもよい。
図11に、複数のエネルギ関数例を示す。図11(a)はラベルからの距離が近いところのみに重みをつける場合、図11(b)はラベルからの距離がやや離れたところに重みをつける場合、図11(c)はラベルからの距離が一番遠いところに重みをつける場合の例である。統合エネルギ関数生成部42が、ラベルごとに範囲の異なるエネルギ関数を複数用意し、最適化処理部43がこれらのエネルギ関数それぞれについて最適化処理を行い、最適な統合結果を探すことが考えられる。
ちなみに、重み付けにガウスフィルタを用いる場合は、上式(6)のσを変更することでエネルギ関数を変更することができる。
なお、複数のエネルギ関数の最適化結果から統合結果を得る場合、それぞれの最適化関数の値が一番小さくなる場合を統合結果としてもよいし、図12に示すように、複数の最適化結果の重なり具合を考慮して統合結果を得てもよい。
図12(a)は、複数のエネルギ関数それぞれの統合結果#1〜#7を示す。統合結果#1〜#3は、図11(a)のようにラベルからの距離が近いところのみに重みをつけたエネルギ関数の最適化結果、統合結果#4,#5は、図11(b)のようにラベルからの距離がやや離れたところに重みをつけたエネルギ関数の最適化結果、統合結果#6,#7は、図11(c)のようにラベルからの距離が一番遠いところに重みをつけたエネルギ関数の最適化結果を表している。このとき、統合結果#4および統合結果#6は、統合結果#1,#2を1つに統合しているため、多数決処理により、統合結果#1,#2の領域を統合した統合結果#4を最終的な統合結果にしている(図12(b))。また、統合結果#4と同じ種類のエネルギ関数の統合結果#5も最終的な統合結果として選択されている。
図12(a)の場合、多数決処理によって統合結果#4,#5および統合結果#6,#7のどちらを最終的な統合結果として選択してもよいが、図12(b)では、より範囲が狭い統合結果#4,#5を選択することにより、文字列切り出し後の文字認識処理を行う際に処理する画素を少なくして処理を速くしている。
また、上記例では、重みαの定数λのバリエーションは各領域で同じとしたが、これに限定されるものではなく、領域の大きさに応じて切り替えてもよい。例えば下式(7),(8)のように領域の縦と横の長さHeight,Widthに応じて重み定数λheight,λwidthを切り替えることが考えられる。
λwidth=α×Width (7)
λheight=α×Height (8)
また、上記例では、重み定数λ,βを固定値にしたが、これに限定されるものではなく、罫線および空白など、特定のパターンの種類に応じて適応的に切り替えてもよい。例えば、図13に示すように、罫線、点線、空白、二重線といったパターンごとに重み定数を設定したテーブルを用意しておく。統合エネルギ関数生成部42は、領域内からこれらのパターンを検出し、検出したパターンに対応する重み定数をテーブルから選択して重みづけすることにより、図14に示すように、エネルギ関数をパターンに応じて強い重みにしたり弱い重みにしたりすることが考えられる。
なお、統合エネルギ関数生成部42による特定のパターン抽出の手法は、例えば上述の参考文献1の手法が考えられる。
また、上記例では、先ず二値化処理部2により画像データの二値化を行ってから、文字列抽出部4による文字列抽出処理を行う構成にしたが、これに限定されるものではない。例えば、二値化処理部2の処理を行わず、グレースケール画像データを用いて領域検出部3、文字列抽出部4および文字認識部5が各処理を行う構成が考えられる。この構成の場合、領域検出部3は、図15のようにグレースケール画像の輝度差などからエッジを検出し、エッジにより囲まれた部分を領域としてもよい。また、文字列抽出部4は、上記エッジに対して重み定数λを定義して、エネルギ関数のエッジ部分を重みづけしてもよい。
また、二値化処理部2の処理を行わず、カラー画像データを用いて領域検出部3、文字列抽出部4および文字認識部5が各処理を行う構成にしてもよい。この場合、領域検出部3はカラー画像の色の違いにより領域を区切ることが考えられる。
以上より、実施の形態1によれば、文字認識装置1の文字列抽出部4は、領域検出部3の検出した領域内から非余白領域(即ち、ラベル)を検出するラベル検出部41と、ラベル検出部41の検出したラベルからの距離に応じて重みづけしたエネルギ関数を生成する統合エネルギ関数生成部42と、統合エネルギ関数生成部42の生成したエネルギ関数に基づく最適化関数を用いて最適化処理を行い、最適化結果に従って領域内のラベルを統合して文字列として抽出する最適化処理部43とを有する構成にした。このため、余白および罫線の検出誤りがある場合、ならびに、画像内に存在する文字の特性(例えば、文字の大きさ)が違う場合であっても、高精度に文字列を抽出でき、文字認識精度を向上させる効果を奏する。
また、実施の形態1によれば、統合エネルギ関数生成部42は、領域検出部3の検出した領域内から特定のパターンを検出し、エネルギ関数に対して当該パターンに対応する重みを加えるように構成した。このため、余白および罫線などに対応して重みを変化させることができ、余白および罫線の検出誤りがあった場合でも適切な領域を取得することができる。
なお、本願発明はその発明の範囲内において、実施の形態の任意の構成要素の変形、もしくは実施の形態の任意の構成要素の省略が可能である。
1 文字認識装置、2 二値化処理部、3 領域検出部、4 文字列抽出部、5 文字認識部、41 ラベル検出部、42 統合エネルギ関数生成部、43 最適化処理部。

Claims (6)

  1. 入力された画像データから所定の領域を検出する領域検出部と、
    前記領域検出部の検出した領域から文字列を抽出する文字列抽出部と、
    前記文字列抽出部の抽出した文字列を認識する文字認識部とを備え、
    前記文字列抽出部は、
    前記領域内から非余白領域を検出するラベル検出部と、
    前記ラベル検出部の検出した非余白領域からの距離に応じて重みづけしたエネルギ関数を生成する統合エネルギ関数生成部と、
    前記統合エネルギ関数生成部の生成したエネルギ関数に基づく最適化関数を用いて最適化処理を行い、最適化結果に従って前記領域内の前記非余白領域を統合して文字列として抽出する最適化処理部とを有することを特徴とする文字認識装置。
  2. 前記統合エネルギ関数生成部は、前記領域内から特定のパターンを検出し、前記エネルギ関数に対して当該パターンに対応する重みを加えることを特徴とする請求項1記載の文字認識装置。
  3. 前記所定の領域は、連続する黒画素で囲まれた領域、連続する白画素で囲まれた領域、および予め決められた形状のシンボルの特定領域のうちの少なくとも1つの領域であることを特徴とする請求項1記載の文字認識装置。
  4. 入力された画像データから所定の領域を検出する領域検出ステップと、
    前記領域検出ステップで検出した領域から文字列を抽出する文字列抽出ステップと、
    前記文字列抽出ステップで抽出した文字列を認識する文字認識ステップとを備え、
    前記文字列抽出ステップは、
    前記領域内から非余白領域を検出するラベル検出ステップと、
    前記ラベル検出ステップで検出した非余白領域からの距離に応じて重みづけしたエネルギ関数を生成する統合エネルギ関数生成ステップと、
    前記統合エネルギ関数生成ステップで生成したエネルギ関数に基づく最適化関数を用いて最適化処理を行い、最適化結果に従って前記領域内の前記非余白領域を統合して文字列として抽出する最適化処理ステップとを有することを特徴とする文字認識方法。
  5. 前記統合エネルギ関数生成ステップは、前記領域内から特定のパターンを検出し、前記エネルギ関数に対して当該パターンに対応する重みを加えることを特徴とする請求項4記載の文字認識方法。
  6. 前記所定の領域は、連続する黒画素で囲まれた領域、連続する白画素で囲まれた領域、および予め決められた形状のシンボルの特定領域のうちの少なくとも1つの領域であることを特徴とする請求項4記載の文字認識方法。
JP2013031992A 2013-02-21 2013-02-21 文字認識装置および文字認識方法 Active JP6076128B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013031992A JP6076128B2 (ja) 2013-02-21 2013-02-21 文字認識装置および文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013031992A JP6076128B2 (ja) 2013-02-21 2013-02-21 文字認識装置および文字認識方法

Publications (2)

Publication Number Publication Date
JP2014164320A true JP2014164320A (ja) 2014-09-08
JP6076128B2 JP6076128B2 (ja) 2017-02-08

Family

ID=51614915

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013031992A Active JP6076128B2 (ja) 2013-02-21 2013-02-21 文字認識装置および文字認識方法

Country Status (1)

Country Link
JP (1) JP6076128B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021149136A (ja) * 2020-03-16 2021-09-27 株式会社アイエスピー シリアルナンバー等文字列抽出サーバ、方法及びプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03172983A (ja) * 1989-12-01 1991-07-26 Ricoh Co Ltd 表処理方法
JPH0855185A (ja) * 1994-08-15 1996-02-27 Matsushita Electric Ind Co Ltd 文字認識装置
JP2001092921A (ja) * 1999-09-17 2001-04-06 Toshiba Corp 文字行領域抽出方法と文字行領域検出に用いられる学習方法
JP2003208567A (ja) * 2002-01-10 2003-07-25 Ricoh Co Ltd 画像処理装置、画像処理方法、及び同方法に用いるプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03172983A (ja) * 1989-12-01 1991-07-26 Ricoh Co Ltd 表処理方法
JPH0855185A (ja) * 1994-08-15 1996-02-27 Matsushita Electric Ind Co Ltd 文字認識装置
JP2001092921A (ja) * 1999-09-17 2001-04-06 Toshiba Corp 文字行領域抽出方法と文字行領域検出に用いられる学習方法
JP2003208567A (ja) * 2002-01-10 2003-07-25 Ricoh Co Ltd 画像処理装置、画像処理方法、及び同方法に用いるプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021149136A (ja) * 2020-03-16 2021-09-27 株式会社アイエスピー シリアルナンバー等文字列抽出サーバ、方法及びプログラム

Also Published As

Publication number Publication date
JP6076128B2 (ja) 2017-02-08

Similar Documents

Publication Publication Date Title
JP6050223B2 (ja) 画像認識装置、画像認識方法、及び集積回路
JP6188976B2 (ja) 画像に含まれるテキストを検出する方法、装置及びコンピュータ読み取り可能な記録媒体
US10438083B1 (en) Method and system for processing candidate strings generated by an optical character recognition process
WO2016033710A1 (en) Scene text detection system and method
JP4100885B2 (ja) 帳票認識装置、方法、プログラムおよび記憶媒体
CN104751093A (zh) 用于获取宿主设备显示的图像识别码的方法和装置
KR102655789B1 (ko) 얼굴 검출 방법 및 장치
WO2014129018A1 (ja) 文字認識装置、文字認識方法及び記録媒体
KR101836811B1 (ko) 이미지 상호간의 매칭을 판단하는 방법, 장치 및 컴퓨터 프로그램
US10509934B1 (en) Methods and apparatus for improving QR code locator detectability and/or finding the corners of a locator pattern
Marne et al. Identification of optimal optical character recognition (OCR) engine for proposed system
JP2019220014A (ja) 画像解析装置、画像解析方法及びプログラム
JP6106808B2 (ja) 文書内バーコード配置特定
WO2020209046A1 (ja) 物体検出装置
US10223583B2 (en) Object detection apparatus
JP6076128B2 (ja) 文字認識装置および文字認識方法
JP2019144703A (ja) 読取システム、読取方法、プログラム、及び記憶媒体
US9607398B2 (en) Image processing apparatus and method of controlling the same
JP2018206260A (ja) 画像処理システム、評価モデル構築方法、画像処理方法及びプログラム
CN113807407B (zh) 目标检测模型训练方法、模型性能检测方法及装置
JP2009259190A (ja) 文字認識プログラムおよび文字認識装置
JP5083162B2 (ja) 画像データ判定装置、画像データ判定システム、及びプログラム
KR101727432B1 (ko) 단계별 영상을 이용한 객체 인식 성능 향상 장치 및 방법
US11443552B2 (en) Image pattern similarity calculation device and recognition device
CN110781977A (zh) 基于空间相关性和极限学习机的运动阴影检测方法及系统

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151202

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161108

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161213

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170110

R150 Certificate of patent or registration of utility model

Ref document number: 6076128

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250