JP5561100B2 - 隠蔽された文字の復元方法及び画像処理装置 - Google Patents

隠蔽された文字の復元方法及び画像処理装置 Download PDF

Info

Publication number
JP5561100B2
JP5561100B2 JP2010241157A JP2010241157A JP5561100B2 JP 5561100 B2 JP5561100 B2 JP 5561100B2 JP 2010241157 A JP2010241157 A JP 2010241157A JP 2010241157 A JP2010241157 A JP 2010241157A JP 5561100 B2 JP5561100 B2 JP 5561100B2
Authority
JP
Japan
Prior art keywords
character
image block
line segment
target
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010241157A
Other languages
English (en)
Other versions
JP2011216070A (ja
Inventor
蘭蘭 常
俊 孫
美佐子 諏訪
浩明 武部
浩 于
聡 直井
悦伸 堀田
源 何
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JP2011216070A publication Critical patent/JP2011216070A/ja
Application granted granted Critical
Publication of JP5561100B2 publication Critical patent/JP5561100B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)

Description

本発明は、一般的に文字認識に関し、具体的には、隠蔽された文字の復元方法及び画像処理装置に関する。
従来、光学文字認識(OCR、Optical Character Recognition)システムは、例えば、撮像された対象物の文字を認識し、認識した文字を出力する。また、近年、デジタルカメラの普及及び機能の増加に伴い、OCRは、一層頻繁に使用されるようになっている。例えば、カメラは、携帯型「スキャナー」として、ハードコピー文書、書物、新聞、及びスローガン、ポスター及びその他の媒体等からテキストを撮像する。
このようなテキストの認識において、OCRシステムは、誤って文字を認識する場合がある。例えば、罫線とテキスト中の文字ストロークが接触・交差している場合に、誤認識を低減するOCRシステムに関する技術が開示されている。また、認識対象であるテキストに書き込みがされている場合に、テキスト中の文字と書き込み部分とを区別するOCRシステムに関する技術が開示されている。
特開2002−366900号公報 特開2010−55353号公報 特開2010−55354号公報
しかしながら、上述した従来の技術では、隠蔽された文字を正確に復元することができないという課題があった。
一般的に、OCRシステムは、文書画像における可視的な透かし文字が、前景の内容に隠蔽されることで、可視的な透かし文字を認識し難しいことになる。図22は、前景に隠蔽された透かし文字の一例を示す図である。図22に示すように、透かし中の文字は、前景により遮られる。このため、OCRシステムは、正確に透かし中の文字を復元することができない。また、OCRシステムは、透かし中の文字を復元し、復元した文字を認識することになるので、透かし中の文字「関係者外秘」を直接には認識できない。
さらに、デジタルカメラによってテキストを撮像する場合、テキストは、常に、光線の不均一、希望しない又は存在している隠蔽物、さらにカメラ内部の処理の影響によって、テキスト中の文字が遮られることになる。このような遮りは、OCRシステムによるテキスト中の文字の認識を困難にする。
開示の技術は、上記に鑑みてなされたものであって、隠蔽された文字を正確に復元することができる、隠蔽された文字の復元方法及び画像処理装置を提供することを目的とする。
第1の案では、隠蔽された文字の復元方法は、復元対象である隠蔽された文字を含む目標文字の筆画の幅に応じて画像ブロックサイズを算出するステップと、目標文字を含む入力画像の目標領域において元領域を標記するステップと、元領域における画素に対してそれぞれを中心とする各参考画像ブロックを生成するステップと、補完対象である入力画像の前景の境界を抽出するステップと、前景の境界における画素毎に、当該画素を中心とする画像ブロックの複雑度に応じて補完優先順位を算出するステップと、参考画像ブロックにおける最も類似している画像ブロックを使用して、最も高い優先順位を有する画素を中心とする画像ブロックを補完するステップと、前景の補完が全て完了していなければ、補完対象である入力画像における前景の境界の抽出処理を実行するステップとを含む。
好ましくは、画像ブロック内部の背景画素が占める割合を計測して算出した信頼係数と、画像ブロック内部の補完対象である目標文字画素が占める割合を計測して算出した信頼係数と、画像ブロック内部の異なる勾配ベクトルの数に基づいた複雑度とから補完優先順位を算出する。
具体的な一実施例において、画像ブロックサイズを目標文字の筆画の幅から算出する。
第1の案の好ましい実施例の一つによれば、目標文字を含む入力画像の目標領域において元領域を標記するステップは、目標文字における画素及びその画像ブロックにおける全ての隣接する画素を含む第一のマスクを生成するステップと、前景画素及びその画像ブロックにおける全ての隣接する画素以外の目標領域全体を含む第二のマスクを生成するステップと、第一のマスクと第二のマスクの重複領域を元領域として抽出するステップとを含む。
第1の案の好ましい実施例の一つによる隠蔽された文字の復元方法は、入力画像を圧縮すること、及び/又は、参考画像ブロックを選別することを実行するステップを更に含む。
第2の案では、隠蔽された文字の復元方法は、目標文字の輪郭画素を抽出するステップと、抽出された輪郭画素に基づいて目標文字の線分を捕捉するステップと、捕捉された線分に基づいて、一つの筆画の対になる線分であると想定される平行線分を選択するステップと、選択された平行線分に基づいて共線線分を平行線ペアとして連結するステップと、目標文字のグレー値を使用して各平行線ペアのそれぞれにより限定された領域を補完するステップとを更に含む。
第2の案の別の好ましい実施例の一つによる隠蔽された文字の復元方法は、捕捉された線分に基づいて目標文字の筆画の幅を推定するステップと、目標文字の投影軸における文字幅と文字高さを推定するステップとを更に含む。ここで、Hough変換領域においては、選択された平行線分は下記の条件を満たす。
1)線分1(θ1、ρ1)、線分2(θ2、ρ2)と筆画の幅SWについては、θ1=θ2及びa*SW<|ρ1−ρ2|<b*SWを満足する(ここで、θは線分の回転角度を示し、ρは線分の零点までの距離を示し、a*SWとb*SWは閾値である)。
2)水平線分については、水平方向θに沿う投影線の間の距離は文字幅よりも小さい一方、垂直線分については、垂直方向(90−θ)に沿う投影線の間の距離は文字高さよりも小さい。
3)二本の線分の間における画素は背景ではなく筆画の内部に位置する。
及び、前記の共線線分は下記の条件を満たす。
1)線分1(θ1、ρ1)、線分2(θ2、ρ2)と筆画の幅SWについては、θ1=θ2及び|ρ1−ρ2|が閾値より小さいことを満足する。
2)水平線分については、水平方向θに沿う投影線の間の距離は文字幅よりも小さい一方、垂直線分については、垂直方向(90−θ)に沿う投影線の間の距離は文字高さよりも小さい。
3)二本の線分の間における画素は背景ではなく筆画の内部に位置することを満足する。
第3の案では、隠蔽された文字の復元方法は、入力画像におけるテキスト領域を認識対象である目標文字、背景と前景に分割するステップと、上述の方法によってテキスト領域中の認識対象である隠蔽された文字を復元するステップと、及び復元された文字を認識するステップとを含む。
第3の案の好ましい実施例の一つによる隠蔽された文字の復元方法は、テキスト領域から認識対象である目標文字を含む目標領域を抽出するステップを更に含む。
第3の案の具体的な実施例の一つにおいて、テキスト領域から認識対象である目標文字を含む目標領域を抽出するステップは、目標文字の輪郭画素を抽出すること、水平方向θと垂直方向(90−θ)において輪郭画素に対してHough変換を実行するステップと(ここでθは目標文字の回転角度を示す)、水平方向θと垂直方向(90−θ)に沿ってHough変換中の最小と最大距離値ρh1、ρh2、ρv1とρv2を求めるステップと、四本の線(ρh1、90−θ)、(ρh2、90−θ)、(ρv1、θ)、(ρv2、θ)を使用して四つの角を算出するステップと、四つの角を覆う領域を目標領域として切り出すステップとを含む。
第4の案では、画像処理装置は、復元対象である隠蔽された文字を含む目標文字の筆画の幅に基づいて画像ブロックサイズを算出する画像ブロックサイズ算出部と、目標文字を含む入力画像の目標領域において元領域を標記する元領域標記部とを有する。また、画像処理装置は、元領域における画素に対してそれぞれを中心とする各参考画像ブロックを生成する参考画像ブロック生成部と、補完対象である入力画像の前景の境界を抽出する境界抽出部とを有する。画像処理装置は、前景の境界における画素毎に、当該画素を中心とする画像ブロックの複雑度に応じて補完優先順位を算出する補完優先順位算出部を有する。また、画像処理装置は、参考画像ブロックにおける最も類似している画像ブロックを使用して、最も高い優先順位を有する画素を中心とする画像ブロックを補完する前景補完部を有する。そして、画像処理装置は、前景の補完が全て完了していない場合には、境界抽出部の処理を実行する判断部を有する。
補完優先順位算出部は、画像ブロック内部の背景画素が占める割合を計測して算出した信頼係数と、画像ブロック内部の補完対象である目標文字画素が占める割合を計測して算出した信頼係数と、画像ブロック内部の異なる勾配ベクトルの数に基づいた複雑度とから補完優先順位を算出する。
第4の案の実施例の一つによる画像処理装置において、画像ブロックサイズを目標文字の筆画の幅から算出する。
第4の案による画像処理装置において、元領域標記部は、目標文字における画素及びその画像ブロックにおける全ての隣接する画素を含む第一のマスクを生成する。また、元領域標記部は、前景画素及びその画像ブロックにおける全ての隣接する画素以外の目標領域全体を含む第二のマスクを生成する。そして、元領域標記部は、第一のマスクと第二のマスクの重複領域を元領域として抽出する。
第4の案の好ましい実施例の一つによる画像処理装置は、入力画像を圧縮し、参考画像ブロックを選別する。
第5の案では、画像処理装置は、目標文字の輪郭画素を抽出する輪郭画素抽出部と、抽出された輪郭画素に基づいて目標文字の線分を捕捉する線分捕捉部とを有する。また、画像処理装置は、捕捉された線分に基づいて、一つの筆画の対になる線分であると想定される平行線分を選択する平行線分選択部と、選択された平行線分に基づいて共線線分を平行線ペアとして連結する共線線分連結部とを有する。そして、画像処理装置は、目標文字のグレー値を使用して各平行線ペアのそれぞれにより限定された領域を補完する領域補完部を有する。
第5の案の実施例の一つによる画像処理装置は、捕捉された線分に基づいて目標文字の筆画の幅を推定する筆画幅推定部と、目標文字の投影軸における文字幅と文字高さを推定するサイズ範囲推定部とを更に含む。ここで、Hough変換領域においては、前記の選択された平行線分は下記の条件を満たす。
1)線分1(θ1、ρ1)、線分2(θ2、ρ2)と筆画の幅SWについては、θ1=θ2及びa*SW<|ρ1−ρ2|<b*SWを満足すること(ここで、θは線分の回転角度を示し、ρは線分の零点までの距離を示し、a*SWとb*SWは閾値である)。
2)水平線分については、水平方向θに沿う投影線の間の距離は文字幅よりも小さい、一方、垂直線分については、垂直方向(90−θ)に沿う投影線の間の距離は文字高さよりも小さい。
3)二本の線分の間における画素は背景ではなく筆画の内部に位置することを満足する。
及び、前記の共線線分は下記の条件を満たす。
1)線分1(θ1、ρ1)、線分2(θ2、ρ2)と筆画の幅SWについては、θ1=θ2及び|ρ1−ρ2|が閾値より小さいことを満足する。
2)水平線分については、水平方向θに沿う投影線の間の距離は文字幅よりも小さい、かつ、垂直線分については、垂直方向(90−θ)に沿う投影線の間の距離は文字高さよりも小さい。
3)二本の線分の間における画素は背景ではなく筆画の内部に位置することを満足する。
第6の案では、画像処理装置は、入力画像におけるテキスト領域を認識対象である目標文字、背景と前景に分割する分割部、上述のような隠蔽された文字の復元装置、及び復元された文字を認識する文字認識部とを有する。
第6の案の実施例の一つによる画像処理装置は、テキスト領域から認識対象である目標文字を含む目標領域を抽出する目標領域抽出部を更に含む。
第6の案の具体的な実施例の一つにおいて、目標領域抽出部は、目標文字の輪郭画素を抽出し、水平方向θと垂直方向(90−θ)において輪郭画素に対してHough変換を実行し、ここで、θは目標文字の回転角度を示し、水平方向θと垂直方向(90−θ)に沿ってHough変換中の最小と最大距離値ρh1、ρh2、ρv1とρv2を求め、四本の線(ρh1、90−θ)、(ρh2、90−θ)、(ρv1、θ)、(ρv2、θ)を使用して四つの角を算出し、更に四つの角を覆う領域を目標領域として切り出す。
また、第7の案では、記憶媒体は、機器で読取可能なプログラムコードを含み、情報処理装置においてプログラムコードが実行されると、プログラムコードが情報処理装置に隠蔽された文字の復元方法を実行させる。
また、第8の案では、プログラム製品は、機器で実行可能な命令を含み、情報処理装置において命令が実行されると、命令が情報処理装置に隠蔽された文字の復元方法を実行させる。
本願の開示する隠蔽された文字の復元方法及び画像処理装置の一つの態様によれば、隠蔽された文字を正確に復元することができるという効果を奏する。
図1は、実施例1に係る隠蔽された文字の復元方法の処理の処理手順を示すフローチャートである。 図2Aは、最初に入力した隠蔽付の画像の一例を示す図である。 図2Bは、7×7サイズの画像ブロックが選択された場合の復元結果を示す図である。 図2Cは、17×17サイズの画像ブロックが選択された場合の復元結果を示す図である。 図3は、標記された元領域の一例を示す図である。 図4Aは、複雑度が最も低い画像ブロックの一例を示す図である。 図4Bは、複雑度が低い画像ブロックの一例を示す図である。 図4Cは、複雑度が高い画像ブロックの一例を示す図である。 図4Dは、複雑度が最も高い画像ブロックの一例を示す図である。 図5は、実施例2に係る隠蔽された文字の復元方法の処理の処理手順を示すフローチャートである。 図6は、復元対象である隠蔽された文字の一例を示す図である。 図7は、図6における目標文字の輪郭画素を抽出した一例を示す図である。 図8は、図7における目標文字の輪郭画素に対して捕捉した文字線分の一例を示す図である。 図9は、実施例2において目標文字サイズを推定する一例を示す図である。 図10は、実施例2において二本の線分の間における画素の帰属を判定する一例を示す図である。 図11は、図8に示した捕捉した文字線分から選択された平行線分の一例を示す図である。 図12は、図11に示した平行線分に対して共線線分の連結処理を実行した結果の一例を示す図である。 図13は、実施例2において目標文字の平行線分の間の領域を補完する一例を示す図である。 図14Aは、補完前の目標文字の一例を模式的に示す図である。 図14Bは、補完後の目標文字の一例を模式的に示す図である。 図15は、実施例3に係る隠蔽された文字の復元方法の処理の処理手順を示すフローチャートである。 図16Aは、実施例3における認識対象である隠蔽された文字を含む入力画像の一例を示す図である。 図16Bは、図16Aに示す入力画像に対して、画像テキスト領域分割ステップを実行した結果の一例を示す図である。 図16Cは、図16Bに示す画像テキスト領域に対して目標領域を抽出する処理を実行した結果の一例を示す図である。 図16Dは、図16Cに示す目標領域に対して隠蔽された文字を復元する処理を実行した結果の一例を示す図である。 図16Eは、図16Dに示す復元後の隠蔽された文字を認識する処理を実行した結果の一例を示す図である。 図17は、実施例3における目標文字の抽出方法の一例を模式的に示した図である。 図18は、実施例4に係る画像処理装置の構成を示すブロック図である。 図19は、実施例5に係る画像処理装置の構成を示すブロック図である。 図20は、実施例6に画像処理装置の構成を示すブロック図である。 図21は、開示技術による隠蔽された文字の復元方法を実行する情報処理装置の構成を示すブロック図である。 図22は、前景に隠蔽された透かし文字の一例を示す図である。
以下に図面と合わせて開示技術の実施例を説明する。説明を簡潔で明確にするために、実際の実施形態の全ての特徴を明細書に記載していないが、いかなる実施例を実用化する場合にも、開発者は、具体的な目的を達成できるように、実施形態に応じて多くの決定を行うことになる。例えば、システム及び業務に関連する制約条件に適合させてもよく、また、これらの制約条件を実施形態によって変更してもよい。これら以外にも、開発作業は非常に複雑で時間を必要とするが、この開示技術からアイデアを得る当業者にとって、これらの作業は実用化に伴う義務に過ぎない。
ここで、開示技術が不明確になるのを避けるために、図面には開示技術と直接関係する装置の構造及び/又は処理のステップのみを示し、開示技術と直接関係しない他のものを省略した。また、開示技術の一つの図面又は一種の実施形態に記載された要素及び特徴は、その他の一つ又は複数の図面あるいは実施形態に示された要素及び特徴と組み合わせてもよい。
以下の図面に基づく開示技術の実施例についての説明を参照すると、開示技術の目的、特徴と利点がより理解し易くなる。図面における要素及び特徴は、開示技術の仕組みを示すために過ぎない。図面には、同一又は類似の技術的特徴又は要素には、同一または類似の符号を付している。
以下に、図面に基づいて、開示技術による隠蔽された文字の復元方法について詳しく説明する。例えば、画像処理装置は、図22に示した透かしを分離、復元して、認識する。
図1は、実施例1に係る隠蔽された文字の復元方法の処理の処理手順を示すフローチャートである。図1に示したように、実施例1に係る隠蔽された文字の復元方法において、画像処理装置は、入力画像圧縮ステップS210、画像ブロックサイズ算出ステップS220、元領域標記ステップS230、参考画像ブロック生成ステップS240を実行する。続いて、画像処理装置は、参考画像ブロック選別ステップS250、境界抽出ステップS260、補完優先順位算出ステップS270、前景補完ステップS280、及び判定ステップS290を実行する。
画像処理装置は、処理の速度を上げるため、ステップS210で入力画像を圧縮する。入力画像の圧縮方法は、圧縮後の画像のサイズが適切であり、かつ筆画の幅が十分であれば、当分野における任意の公知の技術を利用してもよい。なお、この入力画像圧縮ステップS210は省略可能なステップである。すなわち、画像処理装置は、入力画像を圧縮せずに画像ブロックサイズ算出ステップS220から処理を開始してもよい。
画像処理装置は、画像ブロックサイズ算出ステップS220において、復元対象である隠蔽された文字(すなわち認識対象である隠蔽された文字である)を含む目標文字の筆画の幅に応じて画像ブロックサイズを算出する。実験によると、画像ブロックサイズによって、最後の復元結果への影響が異なることを判明している。図2A〜図2Cは、画像ブロックサイズによる隠蔽された文字の復元品質への影響の例を示している。図2Aは、最初に入力した隠蔽付の画像の一例を示す図であり、図2Bは、7×7サイズの画像ブロックが選択された場合の復元結果を示す図であり、図2Cは17×17サイズの画像ブロックが選択された場合の復元結果を示す図である。これらは、同じ寸法サイズのテキスト画像に対して異なる画像ブロックサイズを選択した場合、画像処理装置による復元効果が異なることを示す。
好ましくは、開示技術の具体的な一例によれば、画像ブロックサイズSを式(5)により算出する。
Figure 0005561100
ここで、SWは、目標文字の筆画の幅を示す。画像処理装置は、実施例1により算出した画像ブロックサイズを選択した場合、隠蔽された文字を正確に復元する。
画像ブロックサイズを算出した後、画像処理装置は、元領域標記ステップS230において、目標文字を含む入力画像の目標領域において元領域を標記する。具体的には、実施例1によれば、画像処理装置は、まず目標文字における画素及び該画素の画像ブロックにおける全ての隣接する画素を含む第一のマスクを生成する。次に、画像処理装置は、前景画素及び該前景画素の画像ブロックにおける全ての隣接する画素以外の目標領域全体を含む第二のマスクを生成する。そして、画像処理装置は、第一のマスクと第二のマスクの重複領域を元領域として抽出する。例えば、画像処理装置は、元領域標記ステップS230において、図3に示すように元領域を標記する。なお、図3は、標記された元領域の一例を示す図である。
次に、画像処理装置は、参考画像ブロック生成ステップS240において、ステップS230で標記された元領域における画素に対して参考画像ブロックを生成する。ここで、画像処理装置は、元領域における画素のそれぞれを一つの参考画像ブロックの中心とする。言い換えると、画像処理装置は、元領域における画素に対してそれぞれを中心とする各参考画像ブロックを生成する。画像処理装置は、参考画像ブロックの画像ブロックサイズとして、ステップS220で算出した画像ブロックサイズの大きさを選択する。
生成された参考画像ブロックの数が多く、かつ類似する画像ブロックが多い場合、画像処理装置は、参考画像ブロック選別ステップS250において、ステップS240で生成した参考画像ブロックを選別する。そして、画像処理装置は、類似度の高い参考画像ブロックを一つの参考画像ブロックに合併する。これにより、画像処理装置は、記憶スペースを節約し、かつ後述の前景補完時の探索速度を向上する。なお、画像処理装置は、参考画像ブロック選別ステップS250を実行せずに、境界抽出ステップS260を実行しても良い。
次に、画像処理装置は、境界抽出ステップS260において、補完対象である入力画像の前景の境界を抽出する。続いて、画像処理装置は、補完優先順位算出ステップS270において、前景の境界における画素毎に、該画素を中心とする画像ブロックの複雑度に応じて補完優先順位を算出する。
次に、画像処理装置は、前景補完ステップS280において、参考画像ブロックにおける最も類似している画像ブロックを使用して、最も高い優先順位を有する画素を中心とする画像ブロックを補完する。言い換えると、画像処置装置は、最高の優先順位を有する画素に対して、参考画像ブロックから最も類似する画像ブロックを探索する。そして、画像処理装置は、探索された画像ブロックを当該最高の優先順位を有する画素を中心とする画像ブロックに複製して、補完後の前景の境界を更新する。画像処理装置は、参考画像ブロックを探索する場合に、任意の公知の技術、例えばユークリッド距離等により、補完対象である画像ブロックと最も類似した参考画像ブロックを探索する。
その後、画像処理装置は、判定ステップS290において、前景の補完が全て完了していない場合には、補完対象である入力画像における前景の境界の抽出処理を実行する。言い換えると、画像処理装置は、前景全体の補完が完了したか否かを判定し、補完していない前景の境界がまだ存在していると判定した場合には、境界抽出ステップS260に戻って、以降の処理を順次に実行する。
一方、画像処理装置は、判定ステップS290において、前景全体の補完が完了したと判定した場合には、処理を終了する。
実施例1によれば、画像処理装置は、主に画像ブロックの構成の複雑度に基づいて補完の順序を特定する。これは、補完時の再構成誤差は、前に補完された領域から、次の補完対象である領域まで影響するからである。したがって、画像処理装置は、再構成誤差が生じる可能性が低い画像ブロックを先に再構成してから、複雑度の順で、再構成する必要がある画像ブロックを補完する。これによって、画像処理装置は、最後に再構成された文字の誤差を最小にする。そして、複雑な構成を有する画像ブロックより、簡単な構成を有する画像ブロックは、参考画像ブロックから正確な類似参考画像ブロックを容易に探索することができる。図4A〜図4Dはそれぞれ異なる複雑度を持つ画像ブロックを示している。これにより、図4Aから図4Dまで画像ブロックの複雑度は次第に増加し、簡単な画像ブロックであるほど基本の筆画の要素に近づく。一方、複雑な構成を有する画像ブロックの内部に、一致の特徴を具体化する。
前述のように、簡単な構成を有する画像ブロックを再構成することは、通常、小さい誤差を導入する。したがって、開示技術による具体的な例において、構成の複雑度を計測する因数を使用して補完優先順位に反映する。ここで、画像ブロックの異なるエッジ方向の種類により複雑度C(p)を定義する。
また、下記の式(4)で示すように、画像ブロック内部の異なる勾配ベクトルの数Ngvに基づいて複雑度C(p)を算出する。計算の複雑度を低減するため、実施例1には、下記の式(1)で示した簡単な算式を適用して補完優先順位P(p)を算出する。式(1)中の項R(p)とW(p)は信頼係数を構成し、かつ下記の式(2)と式(3)によりそれぞれ算出される。ここで、信頼係数R(p)は、画像ブロック内部の背景画素が占める割合を計測することで算出される。また、W(p)は、画像ブロック内部の補完対象である目標文字画素が占める割合を計測することで算出される。そして、その内部に補完対象である目標文字画素が存在していない画像ブロックの信頼係数を0とすることにより、再構成の結果に影響せず処理速度を向上することができる。
Figure 0005561100
ここで、前記の式(1)で示した補完優先順位の算出式は、一例に過ぎず、実用化に際しては、状況によって異なる重み係数を使用して複雑度Cに重み付けすることができるので、状況に適した効果を得られる。
実施例1における隠蔽された文字の復元方法によれば、画像ブロックの構成の複雑度に応じて補完順序を特定することにより、不正確な補完順序による顕著な再構成誤差を避けることができる。また、実施例1における隠蔽された文字の復元方法によれば、更に、復元対象である隠蔽された文字の筆画の幅に基づいて画像ブロックサイズの大きさを特定する。したがって、異なる字体に対して、最適なサイズのマッチング画像ブロックを使用して補完を行うことにより、最適な再構成結果を取得することができる。
なお、実施例1による隠蔽された文字の復元方法において、画像処理装置は、入力画像圧縮ステップS210と参考画像ブロック選別ステップS250とを実行しなくてもよく、システム性能と状況に応じて、何れかのステップを選択的に実行するようにしてもよい。
次に図5〜図14に基づいて実施例2による隠蔽された文字の復元方法の処理を説明する。図5は、実施例2に係る隠蔽された文字の復元方法の処理の処理手順を示すフローチャートであり、図6は、復元対象である隠蔽された文字の一例を示す図である。
ここで、図6に示した復元対象である隠蔽された文字を一例として、図5に示した隠蔽された文字の処理の処理手順を詳しく説明する。
図5に示したように、実施例2に係る隠蔽された文字の復元方法において、画像処理装置は、文字輪郭画素抽出ステップS610、文字線分捕捉ステップS620、文字筆画幅推定ステップS630、文字大きさ範囲推定ステップS640を実行する。続いて、画像処理装置は、平行線分選択ステップS650、共線線分連結ステップS660及び領域補完ステップS670を実行する。
文字輪郭画素抽出ステップS610において、画像処理装置は、目標文字の輪郭画素を抽出する。図7は、図6における目標文字の輪郭画素を抽出した一例を示す図である。
次に、文字線分捕捉ステップS620において、画像処理装置は、抽出された輪郭画素に基づいて目標文字の線分を捕捉する。例えば、画像処理装置は、Hough変換の結果に応じて、抽出された輪郭画素により、目標文字の水平方向θと垂直方向(90−θ)における線分を捕捉する。また、画像処理装置は、文字筆画幅推定ステップS630において、捕捉された線分に基づいて目標文字の筆画の幅を推定する。言い換えると、画像処理装置は、二本の隣接する線分の間の最近距離の平均値を使用して目標文字の筆画の幅を粗略に推定する。図8は、図7における目標文字の輪郭画素に対して捕捉した文字線分の一例を示す図である。なお、図中の四角枠内の部分が復元対象である部分であり、すなわち、興味のある線分である。
次に、文字大きさ範囲推定ステップS640において、画像処理装置は、目標文字のサイズの範囲を推定する。すなわち、画像処理装置は、目標文字の投影軸における文字幅と文字高さを推定する。図9は、実施例2において目標文字サイズを推定する一例を示す図である。なお、図中に示した「w」は文字の水平軸に投影された文字幅であり、「h」は文字の垂直軸に投影された文字高さである。
ここで、実施例2に係る隠蔽された文字の復元方法において、画像処理装置は、文字筆画幅推定ステップS630と文字大きさ範囲推定ステップS640とは、実行しなくてもよい。例えば、画像処理装置は、文字線分捕捉ステップS620の実行後に、この二つのステップを実行せずに、次の平行線分選択ステップS650を実行してもよい。
平行線分選択ステップS650において、画像処理装置は、捕捉された線分に基づいて平行線分を選択する。ここで、選択された平行線分は、一つの筆画の対になる線分と推定することができる。言い換えると、画像処理装置は、捕捉された線分に基づいて、一つの筆画の対になる線分であると推定される平行線分を選択する。
実施例2において、画像処理装置は、既に筆画幅と文字高さを取得しているならば、以下の三つの条件に従って平行線分を選択する。Hough変換領域において、線分1(θ1、ρ1)、線分2(θ2、ρ2)と筆画幅SWについては、θは線分の回転角度を示し、ρは線分の零点までの距離を示す。
条件1)θ1=θ2及びa*SW<|ρ1−ρ2|<b*SWを満足しており、ここで、a*SWとb*SWは閾値であり、例えばそれぞれ1.5*SWと0.5*SWである。
条件2)水平線分については、水平方向θに沿う投影線の間の距離は文字幅よりも小さい、かつ、垂直線分については、垂直方向(90−θ)に沿う投影線の間の距離は文字高さよりも小さい。
条件3)二本の線分の間における画素は背景ではなく筆画の内部に位置する。
図10は、実施例2において二本の線分の間における画素の帰属を判定する一例を示す図である。図10に示したように、選択された画素が二本の平行線分における各点の間の連結線上に位置するかどうかを検査することによって画素の帰属を判定する。また、図11は、図8に示した捕捉した文字線分から選択された平行線分の一例を示す図である。
続いて、共線線分連結ステップS660において、選択された平行線分に基づいて、共線線分を平行線ペアとして連結する。
同様に、開示技術の具体的な一実施例によれば、筆画の幅と文字高さを取得した後に、以下の三つの条件に従って共線線分を選択することができる。Hough変換領域において、線分1(θ1、ρ1)、線分2(θ2、ρ2)と筆画幅SWについては、θは線分の回転角度を示し、ρは線分の零点までの距離を示す。
条件1)θ1=θ2及び|ρ1−ρ2|が閾値、例えば1より小さいことを満足する。
条件2)水平線分については、水平方向θに沿う投影線の間の距離は文字幅よりも小さい、かつ、垂直線分については、垂直方向(90−θ)に沿う投影線の間の距離は文字高さよりも小さい。
条件3)二本の線分の間における画素は背景ではなく筆画の内部に位置する。
図12は、図11に示した平行線分に対して共線線分の連結処理を実行した結果の一例を示す図である。
最後に、領域補完ステップS670において、目標文字のグレー値を使用して各平行線ペアのそれぞれにより限定された領域を補完する。図13は、実施例2において目標文字の平行線分の間の領域を補完する一例を示す図である。
画像処理装置は、領域補完ステップS670の処理を完了した後に、隠蔽された目標文字の部分的な筆画を復元する。したがって、画像処理装置は、その後の文字認識処理を便宜として、認識の精度を向上する。図14に示したように、図14Aは、補完前の目標文字の一例を模式的に示す図であり、図14Bは、補完後の目標文字の一例を模式的に示す図である。
以上のように、図面に基づいて開示技術の実施例1及び実施例2に係る、隠蔽された文字の復元方法を詳しく説明した。画像処理装置は、この二つの隠蔽された文字の復元方法を組合せて使用してもよい。この結果、画像処理装置は、より正確に、隠蔽された文字を復元する。そして、画像処理装置は、次に説明する隠蔽された文字の効率的な認識処理をより正確に実行する。
図15は、実施例3に係る隠蔽された文字の復元方法の処理の処理手順を示すフローチャートである。図15に示したように、実施例3に係る隠蔽された文字の復元方法において、画像処理装置は、画像テキスト領域分割ステップS1610、目標領域抽出ステップS1620、文字筆画復元ステップS1630、及び文字認識ステップS1640を実行する。
画像テキスト領域分割ステップS1610において、画像処理装置は、入力画像に対して検出、分割と量子化を実行して、入力画像におけるテキスト領域を認識対象である目標文字、背景及び前景に分割する。当該ステップにおいて、画像処理装置は、まず入力画像におけるテキスト領域を検出する。画像処理装置は、テキスト文字の相違する特徴、例えば垂直エッジグレー値、テクスチャ又はエッジの方向の変化等に基づいて、テキスト領域を検出する。テキスト領域の検出に関する研究は、既に深く進められており、また、それも開示技術の要点ではないので、ここでは詳細な説明を省略する。次に、画像処理装置は、必要な特定画像調整処理を実行することによって、所望の画像を生成する。例えば、画像処理装置は、画像斜め補正処理、ノイズ除去処理、画像拡大/縮小処理等を実行する。当該ステップを実行した後に、画像処理装置は、テキスト領域を目標文字、前景と背景に分割して、異なるグレー値を割り当てる。図16Aは、実施例3における認識対象である隠蔽された文字を含む入力画像の一例を示す図である。図16Bは、図16Aに示す入力画像に対して、画像テキスト領域分割ステップを実行した結果の一例を示す図である。
目標領域抽出ステップS1620において、画像処理装置は、テキスト領域から認識対象である目標文字を含む目標領域を抽出する。
図17は、実施例3における目標文字の抽出方法の一例を模式的に示した図である。実施例3において、画像処理装置は、図17に示した下記のステップに従ってテキスト領域から認識対象である目標文字を含む目標領域を抽出する。すなわち、画像処理装置は、目標文字の輪郭画素を抽出し、水平方向θと垂直方向(90−θ)において輪郭画素に対してHough変換を実行する。ここで、θは、目標文字の回転角度を示す。水平方向θと垂直方向(90−θ)に沿ってHough変換中の最小と最大距離値ρh1、ρh2、ρv1とρv2を求め、四本の線(ρh1、90−θ)、(ρh2、90−θ)、(ρv1、θ)、(ρv2、θ)を使用して四つの角を算出する。また、算出した四つの角を覆う領域を目標領域として切り出す。図16Cは、図16Bに示す画像テキスト領域に対して目標領域を抽出する処理を実行した結果の一例を示す図である。
ここで、当該目標領域抽出ステップS1620は、開示技術に対して必須のものではない。つまり、画像処理装置は、画像テキスト領域分割ステップS1610の終了後に、当該ステップを実行せず、文字筆画復元ステップS1630を実行してもよい。
文字筆画復元ステップS1630において、画像処理装置は、実施例1及び実施例2に記載の方法によりテキスト領域における認識対象である隠蔽された文字を復元する。図16Dは、図16Cに示す目標領域に対して隠蔽された文字を復元する処理を実行した結果の一例を示す図である。
最後に、文字認識ステップS1640において、画像処理装置は、文字筆画復元ステップS1630で復元された文字を認識する。図16Eは、図16Dに示す復元後の隠蔽された文字を認識する処理を実行した結果の一例を示す図である。
以上に、図1〜図17に基づいて実施例1〜実施例3に係る隠蔽された文字の復元方法の処理過程を説明した。以下に図18〜図20を基づいて開示技術による画像処理装置の動作を説明する。
図18は、実施例4に係る画像処理装置1900の構成を示すブロック図である。図18に示すように、実施例4に係る画像処理装置1900は、圧縮部1910、画像ブロックサイズ算出部1920、元領域標記部1930、参考画像ブロック生成部1940、選別部1950、境界抽出部1960、補完優先順位算出部1970、前景補完部1980及び判定部1990を備える。圧縮部1910は、入力画像を圧縮するように配置される。画像ブロックサイズ算出部1920は、復元対象である隠蔽された文字を含む目標文字の筆画の幅に応じて画像ブロックサイズを算出するように配置される。元領域標記部1930は、目標文字を含む入力画像における目標領域において元領域を標識するように配置される。参考画像ブロック生成部1940は、元領域における画素に対して参考画像ブロックを生成するように配置される。ここで、元領域における画素のそれぞれを一つの参考画像ブロックの中心とする。選別部1950は、選考画像ブロックを選別するように配置される。境界抽出部1960は、補完対象である入力画像における前景の境界を抽出するように配置される。補完優先順位算出部1970は、前景の境界における画素毎に当該画素を中心とする画像ブロックの複雑度に応じて補完優先順位を算出するように配置される。前景補完部1980は、参考画像ブロック中の最も類似している画像ブロックを使用して最高の優先順位を有する画素を中心とする画像ブロックを補完するように配置される。判定部1990は、前景の補完が全て完了していない場合に境界抽出部1960、補完優先順位算出部1970及び前景補完部1980の処理を繰返して実行するように配置される。
実施例4に係る画像処理装置1900によれば、画像ブロックサイズ算出部1920は下記の式(5)により画像ブロックサイズを算出する。ここでSWは目標文字の筆画の幅を示す。
Figure 0005561100
実施例4に係る画像処理装置1900によれば、元領域標記部1930は、目標文字における画素及びその画像ブロックにおける全ての隣接する画素を含む第一のマスクを生成する。また、元領域標記部1930は、前景画素及びその画像ブロックにおける全ての隣接する画素以外の目標領域全体を含む第二のマスクを生成する。そして、元領域標記部1930は、第一のマスクと第二のマスクの重複領域を元領域として抽出する。
同様に、補完優先順位算出部1970は、下記の式により補完優先順位P(p)を算出する。
Figure 0005561100
実施例4に係る画像処理装置1900に含まれる圧縮部1910における処理は、実施例1に係る隠蔽された文字の復元方法に含まれる入力画像圧縮ステップS210と同様である。また、画像ブロックサイズ算出部1920における処理は、画像ブロックサイズ算出ステップS220と同様であり、元領域標記部1930における処理は、元領域標記ステップS230と同様である。また、参考画像ブロック生成部1940における処理は、参考画像ブロック生成ステップS240における処理と同様であり、選別部1950における処理は、参考画像ブロック選別ステップS250における処理と同様である。また、境界抽出部1960における処理は、境界抽出ステップS260における処理と同様であり、補完優先順位算出部1970における処理は、補完優先順位算出ステップS270における処理と同様である。また、前景補完部1980における処理は、前景補完ステップS280における処理と同様である。したがって、説明を簡潔にするために、これらの詳細な説明を省略する。
なお、実施例4に係る画像処理装置1900は、実用化に際して、圧縮部1910と選別部1950とを有さず、選択的に設置するように構成されてもよい。
図19は、実施例5に係る画像処理装置2000の構成を示すブロック図である。図19に示したように、実施例5に係る画像処理装置2000は、輪郭画素抽出部2010、線分捕捉部2020、筆画幅推定部2030、サイズ範囲推定部2040、平行線分選択部2050、共線線分連結部2060及び領域補完部2070を備える。輪郭画素抽出部2010は、目標文字の輪郭画素を抽出するように配置される。線分捕捉部2020は、抽出された輪郭画素に基づいて目標文字の線分を捕捉するように配置される。筆画幅推定部2030は、捕捉された線分に基づいて目標文字の筆画の幅を推定するように配置される。サイズ範囲推定部2040は、目標文字の投影軸における文字幅と文字高さを推定するように配置される。平行線分選択部2050は、捕捉された線分に基づいて一つの筆画の対になる線分であると想定される平行線分を選択するように配置される。共線線分連結部2060は、選択された平行線分に基づいて共線線分を平行線ペアとして連結するように配置される。領域補完部2070は、目標文字のグレー値を使用して各平行線ペアのそれぞれにより限定された領域を補完するように配置される。
同様に、選択された平行線分は、Hough変換領域において下記の条件を満足しなければならない。
条件1)線分1(θ1、ρ1)、線分2(θ2、ρ2)と筆画の幅SWについては、θ1=θ2及びa*SW<|ρ1−ρ2|<b*SWを満足しており、θは線分の回転角度を示し、ρは線分の零点までの距離を示し、a*SWとb*SWは閾値である。
条件2)水平線分については、水平方向θに沿う投影線の間の距離は文字幅よりも小さい、一方、垂直線分については、垂直方向(90−θ)に沿う投影線の間の距離は文字高さよりも小さい。
条件3)二本の線分の間における画素は背景ではなく筆画の内部に位置する。
共線線分は、下記の条件を満足しなければならない。
条件1)線分1(θ1、ρ1)、線分2(θ2、ρ2)と筆画幅SWについては、θ1=θ2及び|ρ1−ρ2|が閾値より小さいことを満足する。
条件2)水平線分については、水平方向θに沿う投影線の間の距離は文字幅よりも小さい、かつ、垂直線分については、垂直方向(90−θ)に沿う投影線の間の距離は文字高さよりも小さい。
条件3)二本の線分の間における画素は背景ではなく筆画の内部に位置する。
実施例5に係る画像処理装置2000に含まれる輪郭画素抽出部2010における処理は、実施例2に係る隠蔽された文字の復元方法における文字輪郭画素抽出ステップS610における処理と同様である。また、線分捕捉部2020における処理は、文字線分捕捉ステップS620における処理と同様である。筆画幅推定部2030における処理は、文字筆画幅推定ステップS630における処理と同様である。サイズ範囲推定部2040における処理は、文字サイズ範囲推定ステップS640における処理と同様である。平行線分選択部2050における処理は、平行線分選択ステップS650における処理と同様である。共線線分連結部2060における処理は、共線線分連結ステップS660における処理と同様である。領域補完部2070における処理は、領域補完ステップS670における処理と同様である。したがって、ここでは、説明を簡潔にするために、これら構成部の詳細な説明を省略する。
同様に、実施例5に係る画像処理装置2000は、筆画幅推定部2030とサイズ範囲推定部2040とを設置しなくてもよく、システム設計の要求と使用状況に応じて選択的に設置することができるものである。
隠蔽された文字の復元方法と同様に、実施例5及び実施例6に係る画像処理装置を組合せて使用してもよい。この結果、画像処理装置は、より良い復元効果を発揮して、更に、次に説明する隠蔽された文字の効率的な認識処理を正確に実行する。
図20は、実施例6に係る画像処理装置2100の構成を示すブロック図である。図20に示したように、実施例6に係る画像処理装置2100は、分割部2110、目標領域抽出部2120、隠蔽された文字の復元装置2130及び文字認識部2140を有する。分割部2110は、入力画像におけるテキスト領域を認識対象である目標文字、背景及び前景に分割するように配置される。目標領域抽出部2120は、テキスト領域から認識対象である目標文字を含む目標領域を抽出するように配置される。隠蔽された文字の復元装置2130は、隠蔽された文字を復元するように配置され、例えば、実施例4に係る画像処理装置1900又は実施例5に係る画像処理装置2000である。文字認識部2140は、復元された文字を認識するように配置される。
同様に、具体的な一実施例において、目標領域抽出部2120は、目標文字の輪郭画素を抽出し、水平方向θと垂直方向(90−θ)において輪郭画素に対してHough変換を実行する。ここで、θは目標文字の回転角度を示す。水平方向θと垂直方向(90−θ)に沿ってHough変換中の最小と最大距離値ρh1、ρh2、ρv1とρv2を求め、四本の線(ρh1、90−θ)、(ρh2、90−θ)、(ρv1、θ)、(ρv2、θ)を使用して四つの角を算出する。また、算出した四つの角を覆う領域を目標領域として切り出す。
実施例6に係る画像処理装置2100に含まれる分割部2110における処理は、図15〜図17を参照して説明した隠蔽された文字の復元方法における画像テキスト領域分割ステップS1610における処理と同様である。また、目標領域抽出部2120における処理は、目標領域抽出ステップS1620における処理と同様である。隠蔽された文字の復元装置2130における処理は、文字筆画復元ステップS1630における処理と同様である。すなわち、隠蔽された文字の復元装置2130は、実施例1又は実施例2に係る隠蔽された文字に復元方法を実行する。文字認識部2140における処理は、文字認識ステップS1640における処理と同様である。したがって、説明を簡潔にするために、ここではこれらの構成部の詳細な説明を省略する。
ここで、実施例6に係る画像処理装置2100は、目標領域抽出部2120を設置しなくてもよく、システム設計の要求と使用状況に応じて選択的に設置してもよい。
上述の画像処理装置における各構成モジュール、各構成部は、ソフトウェア、ファームウェア、ハードウェアあるいはそれらの組合せによって配置されてもよい。なお、配置に使用可能な具体的な手法又は方式は公知の技術であり、ここでは説明しない。ソフトウェア又はファームウェアにより実現する場合に、記憶媒体又はネットワークから専用のハードウェア構成を持つコンピュータ(例えば図21に示した情報処理装置1100)に対して当該ソフトウェアを構成するプログラムをインストールする。各種プログラムがインストールされると、情報処理装置1100は、各種機能等を実行する。
図21は、開示技術による隠蔽された文字の復元方法を実行する情報処理装置1100の構成を示すブロック図である。図21においては、中央処理装置(CPU)1101は、読取専用メモリ(ROM)1102に記憶されたプログラム又は記憶部1108からランダムアクセスメモリ(RAM)1103にアップロードされたプログラムに従って、各種の処理を実行する。また、RAM1103は、CPU1101が各種の処理を実行するとき等に必要なデータを記憶してもよい。CPU1101、ROM1102及びRAM1103は、バス1104を介して互いに接続されている。同様に入力/出力インタフェース1105は、バス1104に接続されている。
入力部1106と、出力部1107と、記憶部1108と、通信部1109とは、入力/出力インタフェース1105に接続されている。ここで、入力部1106はキーボード、マウス等を含む。出力部1107は、例えばブラウン管(CRT)や液晶ディスプレイ(LCD)等のディスプレイとスピーカ等を含む。記憶部1108は、ハードディスク等を含む。通信部1109は、例えばLANカード等のネットワークインターフェースカード、モデム等を含む。通信部1109は、例えばインターネット等のネットワークを経由して通信処理を実行する。入力/出力インタフェース1105は、ドライブ1110とも接続されていてもよい。そして、ドライブ1110には、例えば、磁気ディスク、光ディスク、光磁気ディスク、半導体メモリ等のような着脱可能な媒体1111が取り付けられていてもよい。そして、着脱可能な媒体1111から読み出されるコンピュータプログラムが記憶部1108にインストールされるようにしてもよい。
ソフトウェアで一連の処理を実行する場合、例えばインターネット等のネットワーク、又は、例えば着脱可能な媒体1111のような記憶媒体からソフトウェアを構成するプログラムをインストールする。
このような記憶媒体は、図21に示したような、媒体中にプログラムが記憶されているものであって、デバイスから分離してユーザにプログラムを提供する着脱可能な媒体1111に限定されるものではない。例えば、記憶媒体は、ROM1102、記憶部1108に含まれるハードディスクなどでも良い。これらの記憶媒体にプログラムが記憶されており、かつこれらを含むデバイスと一緒にユーザに提供される。なお、着脱可能な媒体1111は、例えば、フロッピー(登録商標)等の磁気ディスク、コンパクトディスクリードオンリーメモリ(CD−ROM)やディジタルヴァーサタイルディスク(DVD)等の光ディスク、ミニディスク(登録商標)等の光磁気ディスク及び半導体メモリである。
開示技術は、機器で読取可能な命令コードが記憶されたプログラム製品を更に提供する。命令コードが機器で読取られて実行されると、開示技術による実施例の方法を実行することができる。
また、機器で読取り可能な命令コードが記憶されたプログラム製品を搭載する記憶媒体も開示技術に含まれる。なお、記憶媒体は、フロッピー(登録商標)ディスク、光ディスク、光磁気ディスク、メモリカード、メモリスティック等を含むが、これらに限定されるものではない。
以上の実施例の記載においては、実施形態の一例について説明した。また、実施例の記載においては示した特徴は、同一あるいは同様の形態で一つ又は複数の他の実施形態で使用されたり、他の実施例における特徴と組み合わせたり、あるいは他の実施例における特徴と置き換えたりしてもよい。
ここで、専門用語“含む/有する”が本文で使用される場合には、特徴、要素、ステップ又は構成部の存在を意味し、一つ又は複数の他の特徴、要素、ステップ又は構成部の存在又は付加を排除するものではない。
なお、開示技術の方法は明細書において説明した時間順に実行されることには限定されず、その他の時間順に従って、並列にあるいは独立に実行されてもよい。したがって、本明細書で説明した方法の実行順序は開示技術の技術的範囲を限定するものではない。
上記に開示技術の実施例を記載することにより、開示技術を説明したが、全ての実施例はいずれも一例に過ぎず、限定的なものではない。当業者であれば、添付の特許請求の範囲と開示技術の技術的思想に基づいて、開示技術に対する各種の修正、改良あるいは同様な装置等を設計する場合がある。これらの修正、改良あるいは同様な装置等は、当然、開示技術の保護範囲内に含まれるものであると考えられる。
以上の各実施例を含む実施形態に関し、さらに以下の付記を開示する。
(付記1)画像処理装置が、
復元対象である隠蔽された文字を含む目標文字の筆画の幅に応じて画像ブロックサイズを算出するステップと、
前記目標文字を含む入力画像の目標領域において元領域を標記するステップと、
前記元領域における画素に対してそれぞれを中心とする各参考画像ブロックを生成するステップと、
補完対象である入力画像の前景の境界を抽出するステップと、
前記前景の境界における画素毎に、当該画素を中心とする画像ブロックの複雑度に応じて補完優先順位を算出するステップと、
前記参考画像ブロックにおける最も類似している画像ブロックを使用して、最も高い優先順位を有する画素を中心とする画像ブロックを補完するステップと、
前記前景の補完が全て完了していない場合には、前記補完対象である入力画像における前景の境界の抽出処理を実行するステップと
を含む隠蔽された文字の復元方法。
(付記2)画像処理装置が、
画像ブロック内部の背景画素が占める割合を計測して算出した信頼係数と、画像ブロック内部の補完対象である目標文字画素が占める割合を計測して算出した信頼係数と、画像ブロック内部の異なる勾配ベクトルの数に基づいた複雑度とから前記補完優先順位を算出する付記1に記載の隠蔽された文字の復元方法。
(付記3)画像処理装置が、
前記画像ブロックサイズを目標文字の筆画の幅から算出する付記1に記載の隠蔽された文字の復元方法。
(付記4)前記目標文字を含む入力画像の目標領域において元領域を標記するステップは、
前記目標文字における画素及び該画素の画像ブロックにおける全ての隣接する画素を含む第一のマスクを生成するステップと、
前景画素及び該前景画素の画像ブロックにおける全ての隣接する画素以外の目標領域全体を含む第二のマスクを生成するステップと、
前記第一のマスクと第二のマスクの重複領域を元領域として抽出するステップと
を含む、付記1に記載の隠蔽された文字の復元方法。
(付記5)画像処理装置が、
入力画像を圧縮すること、及び/又は、参考画像ブロックを選別することを実行するステップを更に含む、付記1に記載の隠蔽された文字の復元方法。
(付記6)画像処理装置が、
前記目標文字の輪郭画素を抽出するステップと、
前記抽出された輪郭画素に基づいて目標文字の線分を捕捉するステップと、
前記捕捉された線分に基づいて、一つの筆画の対になる線分であると推定される平行線分を選択するステップと、
前記選択された平行線分に基づいて共線線分を平行線ペアとして連結するステップと、
前記目標文字のグレー値を使用して各平行線ペアのそれぞれにより限定された領域を補完するステップと
を更に含む、付記1〜付記5の何れかに記載の隠蔽された文字の復元方法。
(付記7)画像処理装置が、
前記捕捉された線分に基づいて目標文字の筆画の幅を推定するステップと、
前記目標文字の投影軸における文字幅と文字高さを推定するステップとを更に含み、
Hough変換領域においては、前記の選択された平行線分は、
線分1(θ1、ρ1)、線分2(θ2、ρ2)と筆画の幅SWについては、θ1=θ2及びa*SW<|ρ1−ρ2|<b*SWとし、θは線分の回転角度を示し、ρは線分の零点までの距離を示し、a*SWとb*SWは閾値であること、
水平線分については、水平方向θに沿う投影線の間の距離は文字幅よりも小さい一方、垂直線分については、垂直方向(90−θ)に沿う投影線の間の距離は文字高さよりも小さいこと、
二本の線分の間における画素は背景ではなく筆画の内部に位置すること
とを満たし、
前記の共線線分は、
線分1(θ1、ρ1)、線分2(θ2、ρ2)と筆画の幅SWについては、θ1=θ2及び|ρ1−ρ2|が閾値より小さいこと、
水平線分については、水平方向θに沿う投影線の間の距離は文字幅よりも小さい一方、垂直線分については、垂直方向(90−θ)に沿う投影線の間の距離は文字高さよりも小さいこと、
二本の線分の間における画素は背景ではなく筆画の内部に位置すること
とを満たす、付記6に記載の隠蔽された文字の復元方法。
(付記8)画像処理装置が、
入力画像におけるテキスト領域を認識対象である目標文字、背景及び前景に分割するステップと、
復元された文字を認識するステップと
を更に実行する付記1〜付記7の何れかに記載の隠蔽された文字の復元方法。
(付記9)画像処理装置が、
テキスト領域から認識対象である目標文字を含む目標領域を抽出するステップを更に含む、付記8に記載の隠蔽された文字の復元方法。
(付記10)前記テキスト領域から認識対象である目標文字を含む目標領域を抽出するステップは、
前記目標文字の輪郭画素を抽出するステップと、
θは目標文字の回転角度を示し、水平方向θと垂直方向(90−θ)において輪郭画素に対してHough変換を実行するステップと、
水平方向θと垂直方向(90−θ)に沿ってHough変換中の最小と最大距離値ρh1、ρh2、ρv1とρv2を求めるステップと、
四本の線(ρh1、90−θ)、(ρh2、90−θ)、(ρv1、θ)、(ρv2、θ)を使用して四つの角を算出するステップと、
前記四つの角を覆う領域を目標領域として切り出すステップと
を含む、付記9に記載の隠蔽された文字の復元方法。
(付記11)復元対象である隠蔽された文字を含む目標文字の筆画の幅に基づいて画像ブロックサイズを算出するように配置された画像ブロックサイズ算出部と、
前記目標文字を含む入力画像の目標領域において元領域を標記するように配置された元領域標記部と、
前記元領域における画素に対してそれぞれを中心とする各参考画像ブロックを生成するように配置された参考画像ブロック生成部と、
補完対象である入力画像の前景の境界を抽出するように配置された境界抽出部と、
前記前景の境界における画素毎に、当該画素を中心とする画像ブロックの複雑度に応じて補完優先順位を算出するように配置された補完優先順位算出部と、
前記参考画像ブロックにおける最も類似している画像ブロックを使用して、最も高い優先順位を有する画素を中心とする画像ブロックを補完するように配置された前景補完部と、
前記前景の補完が全て完了していない場合には、前記境界抽出部の処理を実行するように配置された判定部と
を備える画像処理装置。
(付記12)前記補完優先順位算出部は、画像ブロック内部の背景画素が占める割合を計測して算出した信頼係数と、画像ブロック内部の補完対象である目標文字画素が占める割合を計測して算出した信頼係数と、画像ブロック内部の異なる勾配ベクトルの数に基づいた複雑度とから前記補完優先順位を算出する、付記11に記載の画像処理装置。
(付記13)前記画像ブロックサイズ算出部は、前記画像ブロックサイズを目標文字の筆画の幅から算出する、付記11に記載の画像処理装置。
(付記14)前記元領域標記部は、
前記目標文字における画素及び該画素の画像ブロックにおける全ての隣接する画素を含む第一のマスクを生成し、
前景画素及び該前景画素の画像ブロックにおける全ての隣接する画素以外の目標領域全体を含む第二のマスクを生成し、
前記第一のマスクと第二のマスクの重複領域を元領域として抽出する、
付記11に記載の画像処理装置。
(付記15)入力画像を圧縮するように配置された圧縮部と、
参考画像ブロックを選別するように配置された選別部と
を更に備える、付記11に記載の画像処理装置。
(付記16)前記目標文字の輪郭画素を抽出するように配置された輪郭画素抽出部と、
前記抽出された輪郭画素に基づいて目標文字の線分を捕捉するように配置された線分捕捉部と、
前記捕捉された線分に基づいて、一つの筆画の対になる線分であると推定される平行線分を選択するように配置された平行線分選択部と、
前記選択された平行線分に基づいて共線線分を平行線ペアとして連結するように配置された共線線分連結部と、
前記目標文字のグレー値を使用して各平行線ペアのそれぞれにより限定された領域を補完するように配置された領域補完部と
を更に備える、付記11〜付記15の何れかに記載の画像処理装置。
(付記17)前記捕捉された線分に基づいて目標文字の筆画の幅を推定するように配置された筆画幅推定部と、
前記目標文字の投影軸における文字幅と文字高さを推定するように配置されたサイズ範囲推定部とを更に備え、
Hough変換領域においては、前記の選択された平行線分は、
線分1(θ1、ρ1)、線分2(θ2、ρ2)と筆画の幅SWについては、θ1=θ2及びa*SW<|ρ1−ρ2|<b*SWとし、θは線分の回転角度を示し、ρは線分の零点までの距離を示し、a*SWとb*SWは閾値であること、
水平線分については、水平方向θに沿う投影線の間の距離は文字幅よりも小さい一方、垂直線分については、垂直方向(90−θ)に沿う投影線の間の距離は文字高さよりも小さいこと、
二本の線分の間における画素は背景ではなく筆画の内部に位置することを満たし、
前記の共線線分は、
線分1(θ1、ρ1)、線分2(θ2、ρ2)と筆画の幅SWについては、θ1=θ2及び|ρ1−ρ2|が閾値より小さいこと、
水平線分については、水平方向θに沿う投影線の間の距離は文字幅よりも小さい一方、垂直線分については、垂直方向(90−θ)に沿う投影線の間の距離は文字高さよりも小さいこと、
二本の線分の間における画素は背景ではなく筆画の内部に位置すること
とを満たす、付記16に記載の画像処理装置。
(付記18)入力画像におけるテキスト領域を認識対象である目標文字、背景と前景に分割するように配置された分割部と、
復元された文字を認識するように配置された文字認識部と
を更に有する、付記11〜付記17の何れかに記載の画像処理装置。
(付記19)テキスト領域から認識対象である目標文字を含む目標領域を抽出するように配置された目標領域抽出部を更に備える、付記18に記載の隠蔽された画像処理装置。
(付記20)前記目標領域抽出部は、
前記目標文字の輪郭画素を抽出し、
θは目標文字の回転角度を示し、水平方向θと垂直方向(90−θ)において輪郭画素に対してHough変換を実行し、
水平方向θと垂直方向(90−θ)に沿ってHough変換中の最小と最大距離値ρh1、ρh2、ρv1とρv2を求め、
四本の線(ρh1、90−θ)、(ρh2、90−θ)、(ρv1、θ)、(ρv2、θ)を使用して四つの角を算出し、
前記四つの角を覆う領域を目標領域として切り出す、
付記19に記載の隠蔽された画像処理装置。
1100 情報処理装置
1101 中央処理総理(CPU)
1102 読取専用メモリ(ROM)
1103 ランダムアクセスメモリ(RAM)
1104 バス
1105 入力/出力インタフェース
1106 入力部
1107 出力部
1108 記憶部
1109 通信部
1110 ドライブ
1111 着脱可能な媒体
1900 画像処理装置
1910 圧縮部
1920 画像ブロックサイズ算出部
1930 元領域標記部
1940 参考画像ブロック生成部
1950 選別部
1960 境界抽出部
1970 補完優先順位算出部
1980 前景補完部
1990 判定部
2000 画像処理装置
2010 輪郭画素抽出部
2020 線分捕捉部
2030 筆画幅推定部
2040 サイズ範囲推定部
2050 平行線分選択部
2060 共線線分連結部
2070 領域補完部
2100 画像処理装置
2110 分割部
2120 目標領域抽出部
2130 隠蔽された文字の復元装置
2140 文字認識部

Claims (9)

  1. 画像処理装置が、
    復元対象である隠蔽された文字を含む目標文字の筆画の幅に応じて画像ブロックサイズを算出するステップと、
    前記目標文字を含む入力画像の目標領域において元領域を標記するステップと、
    前記元領域における画素に対してそれぞれを中心とする各参考画像ブロックを生成するステップと、
    補完対象である入力画像の前景の境界を抽出するステップと、
    前記前景の境界における画素毎に、当該画素を中心とする画像ブロックの複雑度に応じて補完優先順位を算出するステップと、
    前記参考画像ブロックにおける最も類似している画像ブロックを使用して、最も高い優先順位を有する画素を中心とする画像ブロックを補完するステップと、
    前記前景の補完が全て完了していない場合には、前記補完対象である入力画像における前景の境界の抽出処理を実行するステップと
    を含む隠蔽された文字の復元方法。
  2. 画像処理装置が、
    画像ブロック内部の背景画素が占める割合を計測して算出した信頼係数と、画像ブロック内部の補完対象である目標文字画素が占める割合を計測して算出した信頼係数と、画像ブロック内部の異なる勾配ベクトルの数に基づいた複雑度とから前記補完優先順位を算出する請求項1に記載の隠蔽された文字の復元方法。
  3. 画像処理装置が、
    前記画像ブロックサイズを目標文字の筆画の幅から算出する請求項1に記載の隠蔽された文字の復元方法。
  4. 前記目標文字を含む入力画像の目標領域において元領域を標記するステップは、
    前記目標文字における画素及び該画素の画像ブロックにおける全ての隣接する画素を含む第一のマスクを生成するステップと、
    前景画素及び該前景画素の画像ブロックにおける全ての隣接する画素以外の目標領域全体を含む第二のマスクを生成するステップと、
    前記第一のマスクと第二のマスクの重複領域を元領域として抽出するステップと
    を含む、請求項1に記載の隠蔽された文字の復元方法。
  5. 画像処理装置が、
    入力画像を圧縮すること、及び/又は、参考画像ブロックを選別することを実行するステップを更に含む、請求項1に記載の隠蔽された文字の復元方法。
  6. 画像処理装置が、
    前記目標文字の輪郭画素を抽出するステップと、
    前記抽出された輪郭画素に基づいて目標文字の線分を捕捉するステップと、
    前記捕捉された線分に基づいて、一つの筆画の対になる線分であると推定される平行線分を選択するステップと、
    前記選択された平行線分に基づいて共線線分を平行線ペアとして連結するステップと、
    前記目標文字のグレー値を使用して各平行線ペアのそれぞれにより限定された領域を補完するステップと
    を更に含む、請求項1〜請求項5の何れかに記載の隠蔽された文字の復元方法。
  7. 画像処理装置が、
    前記捕捉された線分に基づいて目標文字の筆画の幅を推定するステップと、
    前記目標文字の投影軸における文字幅と文字高さを推定するステップとを更に含み、
    Hough変換領域においては、前記の選択された平行線分は、
    線分1(θ1、ρ1)、線分2(θ2、ρ2)と筆画の幅SWについては、θ1=θ2及びa*SW<|ρ1−ρ2|<b*SWとし、θは線分の回転角度を示し、ρは線分の零点までの距離を示し、a*SWとb*SWは閾値であること、
    水平線分については、水平方向θに沿う投影線の間の距離は文字幅よりも小さい一方、垂直線分については、垂直方向(90−θ)に沿う投影線の間の距離は文字高さよりも小さいこと、
    二本の線分の間における画素は背景ではなく筆画の内部に位置すること
    とを満たし、
    前記の共線線分は、
    線分1(θ1、ρ1)、線分2(θ2、ρ2)と筆画の幅SWについては、θ1=θ2及び|ρ1−ρ2|が閾値より小さいこと、
    水平線分については、水平方向θに沿う投影線の間の距離は文字幅よりも小さい一方、垂直線分については、垂直方向(90−θ)に沿う投影線の間の距離は文字高さよりも小さいこと、
    二本の線分の間における画素は背景ではなく筆画の内部に位置すること
    とを満たす、請求項6に記載の隠蔽された文字の復元方法。
  8. 画像処理装置が、
    入力画像におけるテキスト領域を認識対象である目標文字、背景及び前景に分割するステップと、
    復元された文字を認識するステップと
    を更に実行する請求項1〜請求項7の何れかに記載の隠蔽された文字の復元方法。
  9. 復元対象である隠蔽された文字を含む目標文字の筆画の幅に基づいて画像ブロックサイズを算出するように配置された画像ブロックサイズ算出部と、
    前記目標文字を含む入力画像の目標領域において元領域を標記するように配置された元領域標記部と、
    前記元領域における画素に対してそれぞれを中心とする各参考画像ブロックを生成するように配置された参考画像ブロック生成部と、
    補完対象である入力画像の前景の境界を抽出するように配置された境界抽出部と、
    前記前景の境界における画素毎に、当該画素を中心とする画像ブロックの複雑度に応じて補完優先順位を算出するように配置された補完優先順位算出部と、
    前記参考画像ブロックにおける最も類似している画像ブロックを使用して、最も高い優先順位を有する画素を中心とする画像ブロックを補完するように配置された前景補完部と、
    前記前景の補完が全て完了していない場合には、前記境界抽出部の処理を実行するように配置された判定部と
    を備える画像処理装置。
JP2010241157A 2010-03-31 2010-10-27 隠蔽された文字の復元方法及び画像処理装置 Active JP5561100B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201010137689.4 2010-03-31
CN2010101376894A CN102208022A (zh) 2010-03-31 2010-03-31 遮挡字符恢复装置及其方法、遮挡字符识别装置及其方法

Publications (2)

Publication Number Publication Date
JP2011216070A JP2011216070A (ja) 2011-10-27
JP5561100B2 true JP5561100B2 (ja) 2014-07-30

Family

ID=44696844

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010241157A Active JP5561100B2 (ja) 2010-03-31 2010-10-27 隠蔽された文字の復元方法及び画像処理装置

Country Status (2)

Country Link
JP (1) JP5561100B2 (ja)
CN (1) CN102208022A (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103679764B (zh) * 2012-08-31 2016-12-21 西门子公司 一种图像生成方法及装置
KR101635675B1 (ko) * 2014-08-13 2016-07-01 최승규 파쇄된 문서를 복구 하는 장치 및 방법
CN109117843B (zh) * 2018-08-01 2022-04-15 百度在线网络技术(北京)有限公司 字符遮挡检测方法及装置
CN109522900B (zh) * 2018-10-30 2020-12-18 北京陌上花科技有限公司 自然场景文字识别方法及装置
US10825148B2 (en) * 2018-11-29 2020-11-03 Adobe Inc. Boundary-aware object removal and content fill
CN110796585B (zh) * 2019-10-28 2023-02-28 中国人民解放军空军工程大学 一种基于深度学习的图像隐藏方法
CN111340030B (zh) * 2020-02-14 2021-12-21 北京市商汤科技开发有限公司 图像处理方法及装置、电子设备、计算机可读存储介质
CN114820876A (zh) * 2021-01-28 2022-07-29 北京字跳网络技术有限公司 一种文字的轮廓效果处理方法、装置、设备及存储介质
CN113313215B (zh) * 2021-07-30 2021-10-29 腾讯科技(深圳)有限公司 图像数据处理方法、装置、计算机设备和存储介质
CN114511853B (zh) * 2022-04-21 2022-07-12 华南理工大学 一种文字图像书写轨迹恢复效果判别方法
CN117331523B (zh) * 2023-10-26 2024-04-26 湖南给力达电子有限公司 一种柔性显示屏弯曲界面的图像处理方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2951814B2 (ja) * 1993-02-25 1999-09-20 富士通株式会社 画像抽出方式
JPH07121734A (ja) * 1993-10-21 1995-05-12 Fuji Xerox Co Ltd 文字画像編集装置
JPH08339416A (ja) * 1995-06-13 1996-12-24 Kobe Steel Ltd 文字読取方法
JPH1185904A (ja) * 1997-09-03 1999-03-30 Matsushita Graphic Commun Syst Inc 文字切り出し方法及びこれを用いた文字認識装置
JP5098504B2 (ja) * 2007-08-09 2012-12-12 富士通株式会社 文字認識プログラム、文字認識装置および文字認識方法
CN101377811B (zh) * 2007-08-31 2010-06-30 北京万集科技有限责任公司 一种车牌识别的方法与系统
CN101520852B (zh) * 2008-02-29 2011-09-07 富士通株式会社 消失点检测装置和检测方法

Also Published As

Publication number Publication date
CN102208022A (zh) 2011-10-05
JP2011216070A (ja) 2011-10-27

Similar Documents

Publication Publication Date Title
JP5561100B2 (ja) 隠蔽された文字の復元方法及び画像処理装置
US9584729B2 (en) Systems and methods for improving video captured using mobile devices
US20190304066A1 (en) Synthesis method of chinese printed character images and device thereof
US9036905B2 (en) Training classifiers for deblurring images
JP6115323B2 (ja) 文書処理装置、文書処理方法およびスキャナー
US8170368B2 (en) Correcting device and method for perspective transformed document images
JP5896245B2 (ja) テキスト画像のトリミング方法
JP5168185B2 (ja) 画像処理方法、画像処理装置及び透かし検出システム
US11244144B2 (en) Age recognition method, computer storage medium and electronic device
RU2631765C1 (ru) Способ и система исправления перспективных искажений в изображениях, занимающих двухстраничный разворот
US9280830B2 (en) Image processing apparatus and segmentation method
CN114255337A (zh) 文档图像的矫正方法、装置、电子设备及存储介质
JP2016029546A (ja) 画像処理装置、画像処理方法、および画像処理プログラム
JP6542230B2 (ja) 投影ひずみを補正するための方法及びシステム
US9077926B2 (en) Image processing method and image processing apparatus
Xie et al. Feature dimensionality reduction for example-based image super-resolution
JP4983526B2 (ja) データ処理装置及びデータ処理プログラム
CN115272201A (zh) 增强息肉分割模型泛化性的方法、系统、装置和介质
Rosner et al. Image skew detection: A comprehensive study
Karpinski et al. Semi-synthetic data augmentation of scanned historical documents
JP5865687B2 (ja) 画像特徴量抽出装置およびそのプログラム
JP2014029677A (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP6379980B2 (ja) 画像処理装置、画像処理プログラムおよび画像処理方法
Wang Image Retargeting with Robust Multi-Scale Epitomic Resizing and Seamless Merging
KR101878256B1 (ko) 문자를 포함하는 영상의 평활화 방법 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130805

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140418

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140513

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140526

R150 Certificate of patent or registration of utility model

Ref document number: 5561100

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150