JP5939023B2

JP5939023B2 - コンピュータプログラム及び画像抽出装置

Info

Publication number: JP5939023B2
Application number: JP2012110573A
Authority: JP
Inventors: 天宜桂; 明洋皆川; 勝山　裕; 裕勝山; スヌ・ジュヌ; 堀田　悦伸; 悦伸堀田; 直井　聡; 聡直井
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2011-05-31
Filing date: 2012-05-14
Publication date: 2016-06-22
Anticipated expiration: 2032-05-14
Also published as: CN102810155A; JP2012252691A; CN102810155B

Description

本発明は、画像処理分野に関し、特に、画像からテキスト筆画画像を抽出する方法及び装置に関する。

現在の情報処理分野において、大量のビデオファイルが存在している。これらビデオファイルに効率的な検索を行う必要がある。ビデオ注釈、ビデオ探索等については、ビデオにおけるテキスト情報が正確且つ簡単な手がかりとなる。従って、ビデオに含まれるテキスト情報をどのように正確に抽出して認識するかということは、後続のビデオ注釈、ビデオ検索にとって非常に重要である。

既知の幾つかのテキスト筆画の抽出技術は、速度が遅く、ノイズが大きく、筆画の尺度に敏感ではないなどの欠点がある。
上記した課題を解決しうる、画像からテキスト筆画画像を抽出する方法及び装置が望まれる。

以下に、本発明を簡単に説明して本発明の幾つかの態様の基本的な理解を提供する。この簡単な説明は、本発明に対する網羅的なものではない。その目的としては、本発明の肝心部分又は重要部分を決定する意図がなく、本発明の範囲を限定する意図もなく、簡単な形式で幾つかの概念を提供して後述のより詳しい説明の先行説明とすることに過ぎない。
本発明は、画像からテキスト筆画画像を抽出する方法及び装置を提供することを目的とする。

本発明の１つの態様によれば、画像からテキスト筆画画像（text stroke image）を抽出する方法であって、画像のエッジ情報と勾配情報を取得し、取得されたエッジ情報と勾配情報に予め設けられた強調処理（enhancement）を行うことにより、画像においてテキストに関するエッジ情報と勾配情報を強調し、強調されたエッジ情報と勾配情報に対応するテキスト筆画画像を取得することを含む方法が提供される。

本発明の別の態様によれば、画像からテキスト筆画画像を抽出する装置であって、画像のエッジ情報と勾配情報を取得する情報取得手段と、取得されたエッジ情報と勾配情報に予め設けられた強調処理を行うことにより、画像においてテキストに関するエッジ情報と勾配情報を強調する強調手段と、強調されたエッジ情報と勾配情報に対応するテキスト筆画画像を取得する筆画画像取得手段とを備える装置が提供される。

また、本発明の実施の形態では、上記方法を実現するコンピュータプログラムが更に提供される。

また、本発明の実施の形態では、上記方法を実現するコンピュータプログラムコードが記録され、少なくともコンピュータにより読取り可能な媒体の形式のコンピュータプログラムプロダクトが更に提供される。

以下の図面による本発明に対する最適の実施の形態の詳細な説明により、本発明の上記利点及び他の利点がより明らかになるであろう。

以下、図面に基づいて本発明の実施の形態に対する説明を参照し、本発明の上記目的、特徴及び利点、並びに他の目的、特徴及び利点をより容易に理解することができる。図面における構成要素は本発明の原理を示すものに過ぎない。図面において、同一又は類似の技術的特徴又は構成要素は、同一又は類似の符号で示される。
本発明の実施の形態に係る、画像からテキスト筆画画像を抽出する方法を示すフローチャートである。図２は、ステップ信号、パルス信号、ソーベル演算子に対応する信号、ソーベル演算子でステップ信号を抽出した抽出結果、ソーベル演算子でパルス信号を抽出した抽出結果、ステップ信号の抽出結果に絶対値を取った信号、パルス信号の抽出結果に絶対値を取った信号、及び相応のオフセットを行った信号を示す模式図である。本発明による、ソーベル演算子を利用して画像からテキスト筆画画像を抽出する方法を示すフローチャートである。処理される原始画像を示す図である。ソーベル演算子を用いて畳込み処理を行った画像を示す図である。ソーベル演算子を用いて畳込み処理を行った画像を示す図である。ソーベル演算子を用いて畳込み処理を行った画像を示す図である。ソーベル演算子を用いて畳込み処理を行った画像を示す図である。ソーベル演算子を用いて畳込み処理を行った画像を示す図である。ソーベル演算子を用いて畳込み処理を行った画像を示す図である。ソーベル演算子を用いて畳込み処理を行った画像を示す図である。ソーベル演算子を用いて畳込み処理を行った画像を示す図である。ソーベル演算子で処理した画像を対向する方向にオフセットし、且つオフセットした画像を合成して得られた四つの画像を示す図である。ソーベル演算子で処理した画像を対向する方向にオフセットし、且つオフセットした画像を合成して得られた四つの画像を示す図である。ソーベル演算子で処理した画像を対向する方向にオフセットし、且つオフセットした画像を合成して得られた四つの画像を示す図である。ソーベル演算子で処理した画像を対向する方向にオフセットし、且つオフセットした画像を合成して得られた四つの画像を示す図である。ソーベル演算子で処理した画像を反対の方向にオフセットし、且つオフセットした画像を合成して得られた四つの画像を示す図である。ソーベル演算子で処理した画像を反対の方向にオフセットし、且つオフセットした画像を合成して得られた四つの画像を示す図である。ソーベル演算子で処理した画像を反対の方向にオフセットし、且つオフセットした画像を合成して得られた四つの画像を示す図である。ソーベル演算子で処理した画像を反対の方向にオフセットし、且つオフセットした画像を合成して得られた四つの画像を示す図である。整合された細い筆画画像を示す図である。整合した太い筆画画像を示す図である。フィルタリング処理により得られた太い筆画画像を示す図である。本発明の実施の形態に係る、画像からテキスト筆画画像を抽出する装置を示すブロック図である。本発明の実施の形態に係る、ソーベル演算子で画像からテキスト筆画画像を抽出する装置を示すブロック図である。本発明における、画像からテキスト筆画画像を抽出する方法及び装置を実施可能なコンピュータ装置を例として示す構成図である。

以下に、図面を参照して本発明の実施の形態を説明する。本発明の一つの図面又は一種類の実施の形態に説明された要素と特徴は、一つ又はそれ以上の他の図面或いは実施の形態に示された要素及び特徴と結合することができる。ここで、明瞭にするために、図面及び説明において、当業者にとって知られている、本発明と関係ない構成要素と処理の表示及び説明が省略されている。

以下に、図１を参照して本発明の実施の形態に係る、画像からテキスト筆画画像を抽出する方法について説明する。
図１は、本発明の実施の形態に係る、画像からテキスト筆画画像を抽出する方法を示すフローチャートである。図１に示されたように、ステップＳ１０２において、画像のエッジ情報及び勾配情報を取得することができる。
好ましくは、画像のエッジ情報及び勾配情報を表すステップ信号又はパルス信号を解析し、解析結果に基づいてエッジ情報と勾配情報を抽出することができる。

画像において、細い筆画の画像データをパルス信号で示し、太い筆画の画像データ及びそれと類似する大きい尺度対象をステップ信号で示すことができる。パルス信号を解析し、その解析結果に基づいて細い筆画のエッジ情報と勾配情報を抽出することができる。また、ステップ信号を解析し、その解析結果に基づいて太い筆画のエッジ情報と勾配情報を抽出し、太い筆画と類似する大きい尺度対象のエッジ情報と勾配情報を抽出することができる。

以下に、図２を参照して、ソーベル演算子でステップ信号を抽出する過程とソーベル演算子でパルス信号を抽出する過程、及びオフセット処理と合成処理により強調処理を実行する過程について説明する。

図２（i）はステップ信号、図２（ii）はパルス信号、図２（iii）と図２（iv）はソーベル演算子に対応する信号、図２（v）はソーベル演算子でステップ信号を抽出した抽出結果、図２（vi）はソーベル演算子でパルス信号を抽出した抽出結果、図２（vii）はステップ信号の抽出結果に絶対値を取った信号、図２（viii）はパルス信号の抽出結果に絶対値を取った信号、及び図２（ix）と図２（x）は相応のオフセットした信号を示した。

ここで、図２における座標及び大きさは、限定的ではなく、例示的なものであり、且つ関連の信号処理の原理を示すためのものに過ぎない。

図２に示されたように、（図２（iii）に示されるような）ソーベル演算子で（図２（i）に示されるような）ステップ信号を抽出することにより、（図２（v）に示されるような）単一の谷状な信号を取得することができる。その一方、（図２（iv）に示されるような）ソーベル演算子で（図２（ii）に示されるような）パルス信号を抽出することにより、（図２（vi）に示されるような）谷状な信号と山のような信号を結合した信号を取得することができる。以上のように、ソーベル演算子でステップ信号とパルス信号を抽出することにより、（図２（v）と図２（vi）に示されるような）差異の大きい二つの信号を相応的に取得することができる。

次に、後に説明する(例えばオフセット処理と合成処理を含む)強調処理によりステップ信号とパルス信号を強調することができる。これにより、パルス信号に対応する細い筆画の画像データ及びステップ信号に対応する太い筆画の画像データを抽出する。

例えば、ソーベル演算子で抽出されたパルス信号における(図２（vi）に示されるような)谷状な信号に絶対値を取って(即ち谷状な信号の大きさを取る)別の山のような信号（図２（viii）に示されるような）を得ることができる。その後に、当該別の山のような信号と元の山のような信号の部分(即ちソーベル演算子で抽出された山のような信号)を対向的な方向にオフセットさせ、且つオフセットした当該別の山のような信号と元の山のような信号とを重ねることにより(図２（x）に示されるような)、更に当該パルス信号に対応する細い筆画の画像データを強調することができる。また、(図２（v）に示されるような)ソーベル演算子で抽出されたステップ信号における谷状な信号に絶対値を取って、(図２（vii）に示されるような)もう一つの山のような信号を得ることができる。その後、（図２（ix）に示されるような）当該もう一つの山のような信号をオフセットさせる。

選択的に、予め設けられたフィルタリング条件に基づいて、太い筆画と類似する大きい尺度対象のエッジ情報と勾配情報をフィルタリングすると共に、太い筆画のエッジ情報と勾配情報を残すことができる。具体的なフィルタリング処理について後に説明する。

選択的に、画像の明瞭度に基づいて、或いは必要に応じて、図４に示された原始画像に対してフィルタリングしても良い。例えば、ローパスフィルタを用いて原始画像をフィルタリングすることによって画像中のノイズを抑制することができる。ローパスフィルタは、例えばガウシャンフィルタであっても良いが、それに限定されなく、当業者に既知された任意の適当なローパスフィルタであっても良い。

ステップＳ１０４において、取得されたエッジ処理と勾配処理に予め設けられた強調処理を行うことにより、画像においてテキストに関するエッジ情報と勾配情報を強調することができる。

各種の方法でエッジ情報と勾配情報に強調処理を行うことができる。好ましくは、２値化処理と整合処理でエッジ情報と勾配情報を強調することができる。ここでの整合処理は、和集合を求める処理、最大値を求める処理、或いは平均値を求める処理であっても良い。好ましくは、後に説明されるように、整合処理は和集合を求める処理であっても良い。

ステップＳ１０６において、強調されたエッジ情報と勾配情報に対応するテキスト筆画画像を得ることができる。

以下に、図３〜図１０を参照して、本発明の実施の形態に係る、ソーベル演算子で画像からテキスト筆画画像を抽出する方法について説明する。

図３は本発明の実施の形態に係る、ソーベル演算子で画像からテキスト筆画画像を抽出する方法を示すフローチャートである。図４は処理する原始画像を示す図である。図５Ａ〜図５Ｈは、ソーベル演算子で畳み込み処理を行った画像を示す図である。図６Ａ〜図６Ｄは、画像を対向する方向にオフセットさせ、且つオフセットした画像を合成した四つの画像を示す図である。図７Ａ〜図７Ｄは、画像を反対の方向にオフセットさせ、且つオフセットした画像を合成した四つの画像を示す図である。図８は、整合した細い筆画画像を示す図である。図９は、整合した太い筆画画像を示す図である。図１０は、フィルタリング処理を行った太い筆画画像を示す図である。

図３に示されたように、ステップＳ２０２において、（例えば図４に示された原始画像といった）処理される画像に（例えばローパスフィルタといった）平滑化処理を行うことができる。ステップＳ２０２は選択可能なものである。言い換えれば、画像が比較に明瞭である場合に、或いは必要に応じて、図４に示された画像に（例えばローパスフィルタといった）平滑化処理を行わなくても良い。

ここで、図４に示された原始画像を処理すべき画像とする。図４において、抽出されたテキスト筆画に、画像の右上隅にあるFUJITSUと画像の下側の日本語文字を含むと望ましい。なお、FUJITSUは細い筆画の文字、日本語文字は太い筆画の文字である。ここでは、図４が例示的なものに過ぎない。実際に、画像において細い筆画の文字のみ、或いは太い筆画の文字のみが含まれる場合もある。

ステップＳ２０４において、ソーベル（Sobel）演算子で平滑化された画像に畳み込み処理を行うことができる。ステップＳ２０２の平滑化処理が行われない場合に、ソーベル演算子を直接に利用して、（例えば図４に示された原始画像）処理する画像に畳み込み処理を行うことができる。

具体的に、ソーベル演算子を利用して、処理する画像に複数の方向において畳み込み処理を行う。言い換えれば、画像の複数の方向におけるエッジ情報と勾配情報を取得するための複数のソーベル演算子のコンボリューションカーネルを利用して、画像の画像データに畳み込み演算をそれぞれ行う。

例えば、ソーベル演算子を利用して、処理される画像に四つの方向において畳み込み処理を行う。好ましくは、これら四つの方向が水平方向、垂直方向、及び二つの対角線方向を含む。畳み込み処理が行われた画像は、図５Ａ〜５Ｈに示される。これら四つの方向を選択する原因としては、これら四つの方向のそれぞれが常用な筆画
（外１）
に対応するからである。

例えば、利用されたソーベル演算子のコンボリューションカーネルは、以下のようになる。

なお、S_hは水平方向に係るソーベル演算子のコンボリューションカーネル、S_vは垂直方向に係るソーベル演算子のコンボリューションカーネル、S_rdは第１の対角線方向に係るソーベル演算子のコンボリューションカーネル、S_ldは第２の対角線方向に係るソーベル演算子のコンボリューションカーネルである。第１の対角線方向は右上隅から左下隅までの対角線方向、第２の対角線方向は左下隅から右下隅までの対角線方向である。

ここで、畳み込み処理の結果が正と負の両方を含むため、二層の画像を利用して畳み込み結果を記憶することができる。その一つは正パルス応答画像を記憶するために用いられ、もう一つは負パルス応答画像を記憶するために用いられる。言い換えれば、各方向に対する畳み込み演算の結果を、各方向に対する正パルス応答画像データと負パルス応答画像データとに区分する。

本明細書に四つの方向の例が開示されたが、四つの方向において畳み込み演算を行うことに限定されるわけではない。高精度が必要の場合に、或いは他の必要に応じて、より多い方向、例えば８個の方向のソーベル演算子のコンボリューションカーネルを利用して、処理する画像に畳み込み処理を行うことができる。より多い方向の畳み込み演算により、精度のより高い結果を得ることができる。ソーベル演算子の定義及び画像データとの畳み込み処理は、任意の好適な従来の技術によるものであっても良い。

図４に示された原始画像に畳み込み処理を行うことにより、図５Ａ〜図５Ｈに示された、ソーベル演算子のコンボリューションカーネルで畳み込み処理を行った画像を得ることができる。

具体的に、図５Ａは、水平方向の正パルス応答画像データを含む画像、図５Ｂは、水平方向の負パルス応答画像データを含む画像を、それぞれ示す。図５Ｃは、垂直方向の正パルス応答画像データを含む画像、図５Ｄは、垂直方向の負パルス応答画像データを含む画像をそれぞれ示す。図５Ｅは、右上隅から左下隅までの対角線方向の正パルス応答画像データを含む画像、図５Ｆは、右上隅から左下隅までの対角線方向の負パルス応答画像データを含む画像をそれぞれ示す。図５Ｇは、左上隅から右下隅までの対角線方向の正パルス応答画像データを含む画像、図５Ｈは、左上隅から右下隅までの対角線方向の負パルス応答画像データを含む画像をそれぞれ示す。

次に、図６Ａ〜６Ｄ及び図７Ａ〜７Ｄに示されたように、ステップＳ２０６において、予め推定された筆画幅を利用して、正パルス応答画像データと負パルス応答画像データをオフセットし、オフセットされた画像を合成する。

各方向に対する正パルス応答画像データと負パルス応答画像データに対して、それを対向する方向にオフセットし、かつ、加算する演算を実行することによって、各方向に対する第１の合成画像データを得ることができる。また、各方向に対する正パルス応答画像データと負パルス応答画像データに対して、それを反対の方向にオフセットし、かつ、加算する演算を実行することによって、各方向に対する第２の合成画像データを得ることができる。

例えば、対向する方向にオフセットさせ、かつ、加算する演算は、以下の（１）式に基づいて実行されても良い。
I_h(x,y)=(I_h-positive(x,y-w/2)+I_h-negative(x,y+w/2))/2
I_v(x,y)=(I_v-positive(x-w/2,y)+I_v-negative(x+w/2,y))/2
I_rd(x,y)=(I_rd-positive(x+w/2,y-w/2)+I_rd-negative(x-w/2,y+w/2))/2
I_ld(x,y)=(I_ld-positive(x-w/2,y-w/2)+I_ld-negative(x+w/2,y+w/2))/2
また、反対の方向にオフセットし、かつ、加算する演算が以下の（２）式に基づいて実行されても良い。

I_h’(x,y)=(I_h-positive(x,y+w/2)+I_h-negative(x,y-w/2))/2,
I_v’(x,y)=(I_v-positive(x+w/2,y)+I_v-negative(x-w/2,y))/2,
I_rd’(x,y)=(I_rd-positive(x-w/2,y+w/2)+I_rd-negative(x+w/2,y-w/2))/2,
I_ld’(x,y)=(I_ld-positive(x+w/2,y+w/2)+I_ld-negative(x-w/2,y-w/2))/2
なお、xは画素の横座標、yは画素の縦座標、I_h(x,y)、I_v(x,y)、I_rd(x,y)及びI_ld(x,y)は画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する第１の合成画像データをそれぞれ示す。なお、第１の合成画像データを含む画像は、図５Ａ〜５Ｄに示される。

図６Ａは、データI_h(x,y)を含む画像、図６Ｂは、データI_v(x,y)を含む画像、図６Ｃは、データI_rd(x,y)を含む画像、図６Ｄは、データI_ld(x,y)を含む画像をそれぞれ示す。

I_h’(x,y)、I_v’(x,y)及びI_rd’(x,y)、I_ld’(x,y)は、画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する第２の合成画像データをそれぞれ示す。なお、第２の合成画像データを含む画像は図７Ａ〜７Ｄに示される。

図７Ａは、データI_h’(x,y)を含む画像、図７Ｂは、データI_v’(x,y)を含む画像、図７Ｃは、データI_rd’(x,y)を含む画像、図７Ｄは、データI_ld’(x,y)を含む画像をそれぞれ示す。

I_h-positive(x,y)、I_v-positive(x,y)、I_rd-positive(x,y)及びI_ld-positive(x,y)は、画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する正パルス応答画像データをそれぞれ示す。なお、正パルス応答画像データを含む画像は、図５Ａ、図５Ｃ、図５Ｅと図５Ｇに示された。

I_h-negative(x,y)、I_v-negative(x,y)、I_rd-negative(x,y)及びI_ld-negative(x,y)は、画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する負パルス応答画像データをそれぞれ示す。なお、負パルス応答画像データを含む画像は、図５Ｂ、図５Ｄ、図５Ｆと図５Ｈに示される。

前記処理に係るｗは、予め推定された筆画幅である。例えば、経験によってｗの値を推定しても良く、或いは画像を目視してｗの値を推定しても良い。また、前記の（１）式と（２）式は、画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する画像データに合成処理を行う具体的な例のみを示したが、本発明に限定するものではない。実際に、筆画を強調する適切な合成処理であれば、任意の処理が適用される。

ここで、対向する方向へのオフセット及び反対の方向へのオフセットを行うことは、非特定な画像にどの方向へのオフセットにより筆画の強調の効果を実現できるかを容易に特定するとは限らないからである。従って、対向する方向へのオフセット及び反対の方向へのオフセットをそれぞれ試して行うことにより、必ず筆画の強調の効果を実現することができる。事前にどの方向へのオフセットにより筆画の強調の効果を実現できるかを特定できれば、対向する方向へのオフセット及び反対の方向へのオフセットを同時に実行する必要がなくなる。即ち、対向する方向へのオフセットと反対の方向へのオフセットのいずれかを実行すれば良い。本明細書に示した画像の例では、図６Ａ〜６Ｄに示されるように、対向する方向にオフセットすることにより筆画の強調の効果を実現することができる。図７Ａ〜７Ｄに示されたように、反対する方向にオフセットすることにより筆画の強調の効果を実現することができない。

ステップＳ２０８において、ステップＳ２０６に合成された画像に高い閾値による２値化処理と整合処理を行うことができる。

例えば、予め設けされた高い閾値を用いて、各方向に対する第１の合成画像データと第２の合成画像データに高い閾値による２値化処理をそれぞれ行うことができる。高い閾値による２値化処理が行われた、各方向に対する第１の合成画像データに整合処理を行い、高い閾値による２値化処理が行われた、各方向に対する第２の合成画像データに整合処理を行う。

ここでの整合処理は、和集合を求める処理、最大値を求める処理、或いは平均値を求める処理のいずれか一つの処理であっても良い。

整合処理が和集合を求める処理であれば、以下の式に従って和集合を求める処理を行うことができる。

I_output-thin=I_{h-binarized-high}∪I_{v-binarized-high}∪I_{rd-binarized-high}∪I_{ld-binarized-high}
I’_output-thin=I’_{h-binarized-high}∪I’_{v-binarized-high}∪I’_{rd-binarized-high}∪I’_{ld-binarized-high}
なお、I_output-thinは、和集合が求められた第１の細い筆画画像データであり、I_{h-binarized-high}、I_{v-binarized-high}、I_{rd-binarized-high}及びI_{ld-binarized-high}のそれぞれは、第１の合成画像データI_h(x,y)、I_v(x,y)、I_rd(x,y)及びI_ld(x,y)に高い閾値による２値化処理を行った２値化画像データである。なお、I’_output-thinは、和集合が求められた第２の細い筆画画像データであり、I’_{h-binarized-high}、I’_{v-binarized-high}、I’_{rd-binarized-high}及びI’_{ld-binarized-high}のそれぞれは、第２の合成画像データI_h’(x,y)、I_v’(x,y)、I_rd’(x,y)及びI_ld’(x,y)に高い閾値による２値化処理を行った２値化画像データである。

ステップＳ２１０において、細い筆画画像データを取得することができる。即ち、I_output-thinとI’_output-thinを取得する。

ステップＳ２１２において、合成された画像に低い閾値による２値化処理と整合処理を行うことができる。

例えば、予め設けられた、前記高い閾値よりも小さい低い閾値を利用して、各方向に対する第１の合成画像データと第２の合成画像データに低い閾値による２値化処理をそれぞれ行うことができる。低い閾値による２値化処理が行われた、各方向に対する第１の合成画像データには、整合処理が施され、第２の２値化処理が行われた、各方向に対する第２の合成画像データには、整合処理が施される。

整合処理が和集合を求める処理であれば、例えば、以下の式に従って和集合を求める処理を行うことができる。
I_output-thick=I_{h-binarized-low}∪I_{v-binarized-low}∪I_{rd-binarized-low}∪I_{ld-binarized-low}
I’_output-thick=I’_{h-binarized-low}∪I’_{v-binarized-low}∪I’_{rd-binarized-low}∪I’_{ld-binarized-low}
なお、I_output-thickは、和集合が求められた第１の太い筆画画像データであり、I_{h-binarized-low}、I_{v-binarized-low}、I_{rd-binarized-low}及びI_{ld-binarized-low}のそれぞれは、第１の合成画像データI_h(x,y)、I_v(x,y)、I_rd(x,y)及びI_ld(x,y)に低い閾値による２値化処理を行った２値化画像データである。なお、I’_output-thickは、和集合が求められた第２の太い筆画画像データであり、I’_{h-binarized-low}、I’_{v-binarized-low}、I’_{rd-binarized-low}及びI’_{ld-binarized-low}のそれぞれは、第２の合成画像データI_h’(x,y)、I_v’(x,y)、I_rd’(x,y)及びI_ld’(x, y)に低い閾値による２値化処理を行った２値化画像データである。

以上のように、事前にどの方向へのオフセットにより筆画の強調の効果を実現できるかを特定できれば、対向する方向へのオフセットと反対の方向へのオフセットを同時に実行して第１の合成画像データと第２の合成画像データを取得する必要がなくなる。即ち、（例えば対向する方向又は反対の方向といった）筆画の強調の効果を実現できる方向においてオフセットを行い、相応の合成画像データが取得される。一方、当該合成画像データには、前記の２値化処理と整合処理が施される。

ステップＳ２１４において、選択的に、予め設けられたフィルタリング条件に応じて、ステップＳ２１２で処理されたデータがフィルタリングされる。

具体的に、予め設けられたフィルタリング条件を利用して、第１の太い筆画画像データと第２の太い筆画画像データにおける連通領域に関するデータにフィルタリング処理をそれぞれ行うことにより、予め設けられたフィルタリング条件を満足する第１の連通領域の画像データと第２の連通領域の画像データが取得される。

ここで予め設けられたフィルタリング条件を利用して第１の太い筆画画像データと第２の太い筆画画像データにフィルタリング処理を行うことは、ステップＳ２１２で得られた第１の太い筆画画像データと第２の太い筆画画像データに、太い筆画に加えて、例えば画像における人間のエッジデータといった、その他のオブジェクトのエッジデータ又はその他の太い筆画と類似するエッジデータが含まれる可能性があるからである。予め設けられたフィルタリング条件を利用して第１の太い筆画画像データと第２の太い筆画画像データにフィルタリング処理を行うことにより、太い筆画に対応する連通領域の画像データをより正確に取得することができる。

なお、予め設けられたフィルタリング条件は、（１）連通領域内の画素の階調分散が予め設けられた分散閾値よりも小さいこと、(２)連通領域の内側エッジから外側エッジまでの画素の極性が一致すること、及び(３)連通領域の大きさが予め設けられた大きさ閾値以内にあること、のいずれかであっても良い。或いは、フィルタリング条件は、上記（１）、（２）及び（３）のうち、二つ又は複数の条件の任意の組み合わせであっても良い。

ここで、連通領域とは、ステップＳ２１２の処理により得られた太い筆画画像データが示したエッジからなる閉じた領域である。

フィルタリング条件（１）、即ち連通領域内の画素の階調分散が予め設けられた分散閾値よりも小さいことは、具体的に、まずステップＳ２１２で処理された画像において連通領域に関する座標情報を取得することができる。次に座標情報及び図４に示された原始画像に基づいて連通領域の階調分散を特定し、当該連通領域内の階調分散が予め設けられた分散閾値よりも小さいか否かを判断する。連通領域内の階調分散が予め設けられた分散閾値よりも小さい場合に、当該連通領域を保留し、即ち当該連通領域が太い筆画と関連あると考えられる。さもなければ、当該連通領域をフィルタリングする。

フィルタリング条件（２）、即ち連通領域の内側エッジから外側エッジまでの画素極性が一致であることは、具体的に、まずステップＳ２１２で処理された画像において連通領域に関する座標情報を取得することができる。次に座標情報及び図４に示された原始画像に基づいて連通領域の内側エッジから外側エッジまでの画素極性が一致か否かを特定する。連通領域内の内側エッジと外側エッジの画素極性が一致である場合に、当該連通領域を保留し、即ち当該連通領域が太い筆画と関連あると考えられる。さもなければ、当該連通領域をフィルタリングする。

ここでの画素の極性は、一つの内側エッジの画素の諧調と、当該内側エッジの画素と隣接する外側エッジの画素の階調との関係として理解されても良い。例えば、２値化画像における画素の階調が「０」或いは「２５５」に設置される場合に、二つの画素の階調値が何れも「０」或いは「２５５」であれば、この二つの画素の極性が一致であると考えられる。さもなければ、極性が不一致であると考えられる。勿論、必要に応じて画素極性が一致であるその他の適切な条件を設定しても良く、ここでは詳しく説明しない。

フィルタリング条件（３）、即ち連通領域の大きさが予め設けられた大きさ領域以内にあることは、具体的に、連通領域の大きさが予め設けられた閾値以内にあれば、当該連通領域を保留し、即ち当該連通領域が太い筆画と関連あると考えられる。さもなければ、当該連通領域をフィルタリングする。ここで、太い筆画画像が細い筆画画像よりも大きいであるが、一般的に比較的な共通の上限があるため、当該上限に基づいて前記の予め設けられた閾値を設定しても良いことは、容易に理解できる。連通領域のサイズが大きすぎであれば、当該連通領域が対応するのは太い筆画ではなく非筆画対象であると考えても良い。例えば、殆どの場合に、太い筆画サイズが画像全体のサイズの半分ひいては半分以上を占拠することはない。勿論、特別な場合に太い筆画のサイズが確かに大きいであれば、前記の予め設けられた閾値の大きさを調整すればこのような態様を反映することができる。

なお、前記の予め設けられた分散閾値と予め設けられた大きさ閾値は、予め試験によって得られた経験値に基づいて特定しても良く、或いは、画像サンプルに対する目視に基づいて特定しても良い。勿論、任意のその他の適切な方法で特定しても良い。

フィルタリング条件（１）、（２）及び（３）のうち、二つ又は全部の条件を組み合わせてフィルタリングを実行することもできる。

次に、ステップＳ２１６において、第１の連通領域の画像データと第２の連通領域の画像データにそれぞれ対応する第１の太い筆画エッジ画像データと第２の太い筆画エッジ画像データを取得する。

ステップＳ２１８において、第１の細い筆画画像データと第２の細い筆画画像データにそれぞれ対応する（図８に示されるような）第１の細い筆画画像と第２の細い筆画画像（図示せず）を取得し、第１の太い筆画エッジ画像データと第２の太い筆画エッジ画像データにそれぞれ対応する（図１０に示されるような）第１の太い筆画画像と第２の太い筆画画像（図示せず）を取得する。

理解すべきなのは、ステップＳ２１４を実行しない場合でも太い筆画画像を取得することができる。言い換えれば、ステップＳ２１２で取得されたI_output-thickとI’_output-thickに基づいて（図９に示されるような）第１の太い筆画画像と第２の太い筆画画像を取得することができる。

本明細書において、前記ステップにより第２の細い筆画画像と第２の太い筆画画像を取得することができるが、反対の方向へのオフセットにより筆画の強調の効果を実現できないため、対応的に得られた第２の細い筆画画像や第２の太い筆画画像を具体的に示していない。

選択的に、テキスト筆画の精度、テキスト筆画のリコールレート、或いはテキスト筆画の精度とテキスト筆画のリコールレートとの折衷に基づいて、第１の細い筆画画像と第２の細い筆画画像のいずれかを最終的な細い筆画画像として選別することができる。また、テキスト筆画の精度、テキスト筆画のリコールレート、或いはテキスト筆画の精度とテキスト筆画のリコールレートとの折衷に基づいて、第１の太い筆画画像と第２の太い筆画画像のいずれかを最終的な太い筆画画像として選別することもできる。本明細書の例において、対向する方向へのオフセットにより筆画の強調の効果を実現できるため、テキスト筆画の精度、テキスト筆画のリコールレート、或いはテキスト筆画の精度とテキスト筆画のリコールレートとの折衷に基づいて、第１の細い筆画画像と第１の太い筆画画像を最終的な筆画抽出結果として取得することができる。

本明細書に言及されたテキスト筆画の精度は、実際に検出された正しい筆画の数と実際に検出された筆画の数との比として理解されても良い。テキスト筆画のリコールレートは、実際に検出された正しい筆画の数と実際に存在した正しい筆画の数との比として理解されても良い。

以上のように、ソーベル演算子を例として画像からテキスト筆画画像を抽出する方法を説明した。しかしながら、ただ例示的な方式で画像からテキスト筆画画像を抽出する方法を説明するに過ぎない。使用可能な演算子はこれに限定されなく、Robert演算子、Prewitt演算子、Laplace演算子、log演算子、Canny演算子、或いはその他の任意の適切な演算子であっても良い。

また、ステップＳ２０８とＳ２１２で２値化処理を行ってから整合処理を行うことを説明したが、実際に整合処理を行ってから２値化処理を行っても良い。

以上に言及された高い閾値と低い閾値は、経験によって特定されても良く、或いは何回かの試験によって特定されても良い。しかしながら、これはただ例示的なものに過ぎず、任意の適切な方法で高い閾値と低い閾値を特定することができる。

以下、図１１を参照して、本発明の実施の形態に係る、画像からテキスト筆画画像を抽出する装置４００を説明する。

図１１は、本発明の実施の形態に係る、画像からテキスト筆画画像を抽出する装置４００を示すブロック図である。装置４００は、例えば、上述のように図１を参照して説明された、画像からテキスト筆画画像を抽出する方法を実行することができる。

具体的に、装置４００は、前記画像のエッジ情報と勾配情報を取得する情報取得手段４０２と、取得されたエッジ情報と勾配情報に予め設けられた強調処理を行うことにより、前記画像におけるテキストに関するエッジ情報と勾配情報を強調する強調手段４０４と、強調されたエッジ情報と勾配情報に対応するテキスト筆画画像を取得する筆画画像取得手段４０６とを備える。

選択的に、装置４００は、選別手段（図示せず）を備えても良い。選別手段は、抽出された複数のテキスト筆画画像に選別を行うように配置される。

情報取得手段４０２は、代表画像のエッジ情報と勾配情報のステップ信号又はパルス信号を解析し、解析結果に基づいてエッジ情報と勾配情報を抽出するように配置される。

画像において、細い筆画の画像データはパルス信号で表し、太い筆画の画像データ及び太い筆画と類似する大きい尺度対象は、ステップ信号で表すことができる。パルス信号を解析し、その解析結果に基づいて細い筆画のエッジ情報と勾配情報を抽出することができる。また、ステップ信号を解析し、その解析結果に基づいて、太い筆画のエッジ情報と勾配情報を抽出し、太い筆画と類似する大きい尺度対象のエッジ情報と勾配情報を抽出することができる。

選択的に、装置４００は、更にノイズ削減手段（図示せず）を備えても良い。ノイズ削減手段は、画像の明瞭度に基づいて、或いは必要に応じて、原始画像にフィルタリングを行ってノイズを削減するように配置される。例えば、ローパスフィルタを利用して画像をフィルタリングすることにより、原始画像におけるノイズを削減することができる。ローパスフィルタは、ガウシアンフィルタであっても良いが、それに限定されなく、当業者にとって知られている任意の適切なローパスフィルタであっても良い。

強調手段４０４は、各種の方法に基づいてエッジ情報と勾配情報に強調処理を行うように配置される。好ましくは、２値化処理と整合処理によりエッジ情報と勾配情報を強調することができる。ここでの強調処理は、和集合を求める処理、最大値を求める処理、或いは平均値を求める処理の何れかであっても良い。好ましくは、後述されるように、整合処理は和集合処理であっても良い。

以下に、図１２を参照して、本発明の実施の形態に係る、ソーベル演算子で画像からテキスト筆画画像を抽出する装置４００’を説明する。

図１２は、本発明の実施の形態に係る、ソーベル演算子で画像からテキスト筆画画像を抽出する装置４００’を示すブロック図である。

装置４００’は、上述されたように図３〜図１０に示された、本発明の実施の形態に係るソーベル演算子で画像からテキスト筆画画像を抽出する方法を実行することができる。

具体的には、装置４００と同様に、装置４００’は、情報取得手段４０２’と、強調手段４０４’と、筆画画像取得手段４０６’とを備える。選択的に、装置４００’は、選別手段とノイズ削減手段（何れも図示せず）を備えても良い。

選別手段は、テキスト筆画の精度とテキスト筆画のリコールレートとのうち少なくとも一つに基づいて、前記第１の細い筆画画像と前記第２の細い筆画画像の何れかを最終的な細い筆画画像として選別し、及び/又は、前記第１の太い筆画画像と前記第２の太い筆画画像の何れかを最終的な太い筆画画像として選別するように配置される。具体的な選別処理は、図３〜図１０を参照して説明されたため、ここでは説明を重複しない。

ノイズ削減手段は、原始画像（即ち処理する画像）をフィルタリングしてノイズを削減するように配置される。具体的なノイズ削減処理は、図３〜図１０に参照して説明されたため、ここでは説明を重複しない。

なお、情報取得手段４０２’は、畳み込み演算サブ手段４０２２と区分サブ手段４０２４とを備えても良い。畳み込み演算サブ手段４０２２は、画像の複数の方向におけるエッジ情報と勾配情報を取得するための複数のソーベル演算子のコンボリューションカーネルを利用して前記画像の画像データと畳み込み演算をそれぞれ行うするように配置される。区分サブ手段４０２４は、各方向に対する畳み込み演算の結果を各方向に対する正パルス応答画像データと負パルス応答画像データとに区分するように配置される。

強調手段４０４’は、第１の合成画像取得サブ手段４０４２及び/又は第２の合成画像取得サブ手段４０４４を備えても良い。第１の合成画像取得サブ手段４０４２は、各方向に対する正パルス応答画像データと負パルス応答画像データに、対向する方向へのオフセット及び加算を実行することにより、各方向に対する第１の合成画像データを取得するように配置される。第２の合成画像取得サブ手段４０４４は、各方向に対する正パルス応答画像データと負パルス応答画像データに、反対の方向へのオフセット及び加算を実行することにより、各方向に対する第２の合成画像データを取得するように配置される。

前記筆画画像取得手段４０６’は、第１の２値化処理サブ手段４０６２と、第１の細い筆画画像取得サブ手段４０６４と、第２の細い筆画画像取得サブ手段４０６６と、第２の２値化処理サブ手段４０６８と、第１の太い筆画画像取得サブ手段４０６１０と、第２の太い筆画画像取得サブ手段４０６１２とを備えても良い。

第１の２値化処理サブ手段４０６２は、予め設けられた第１の閾値を利用して各方向に対する第１の合成画像データと第２の合成画像データに第１の２値化処理をそれぞれ行うように配置される。

第１の細い筆画画像取得サブ手段４０６４は、第１の２値化処理が行われた各方向に対する第１の合成画像データに整合処理を行って第１の細い筆画画像データを取得することにより、前記第１の細い筆画画像データに対応する第１の細い筆画画像を取得するように配置される。

第２の細い筆画画像取得サブ手段４０６６は、第１の２値化処理が行われた各方向に対する第２の合成画像データに整合処理を行って第２の細い筆画画像データを取得することにより、前記第２の細い筆画画像データに対応する第２の細い筆画画像を取得するように配置される。

第２の２値化処理サブ手段４０６８は、予め設けられた、第１の閾値よりも小さい第２の閾値を利用して各方向に対する第１の合成画像データと第２の合成画像データに第２の２値化処理をそれぞれ行うように配置される。

第１の太い筆画画像取得サブ手段４０６１０は、第２の２値化処理が行われた各方向に対する第１の合成画像データに整合処理を行って第１の太い筆画画像データを取得することにより、前記第１の太い筆画画像データに対応する第１の太い筆画画像を取得するように配置される。

第２の太い筆画画像取得サブ手段４０６１２は、第２の２値化処理が行われた各方向に対する第２の合成画像データに整合処理を行って第２の太い筆画画像データを取得することにより、前記第２の太い筆画画像データに対応する第２の太い筆画画像を取得するように配置される。

筆画画像取得手段４０６は、必要に応じて、第１の２値化処理サブ手段４０６２、第１の細い筆画画像取得サブ手段４０６４、第２の細い筆画画像取得サブ手段４０６６のみを備えても良いし、或いは、第２の２値化処理サブ手段４０６８、第１の太い筆画画像取得サブ手段４０６１０、第２の太い筆画画像取得サブ手段４０６１２のみを備えても良い。言い換えれば、筆画画像取得手段４０６は、必要に応じて、細い筆画画像又は太い筆画画像のみを取得するように配置される。例えば、処理する画像において太い筆画又は細い筆画のテキスト情報のみが存在し、或いは太い筆画又は細い筆画のテキスト情報のみを取得する必要がある場合が該当する。

更に、以上のように、事前にどの方向へのオフセットにより筆画の強調の効果を実現できるかを特定することができれば、強調手段４０４’は、第１の合成画像取得サブ手段４０４２と第２の合成画像取得サブ手段４０４４とのうち、当該方向における処理に対応する合成画像取得サブ手段を備えても良い。一方、筆画画像取得手段４０６’は、第１の細い筆画画像取得サブ手段４０６４と第２の細い筆画画像取得サブ手段４０６６とのうち、当該方向における処理に対応するもの、及び第１の太い筆画画像取得サブ手段４０６１０と第２の太い筆画画像取得サブ手段４０６１２とのうち、当該方向における処理に対応するもののみを備えても良い。

装置４００’は、例えば、上述のように図３〜図１０に示された、本発明の実施の形態に係るソーベル演算子で画像からテキスト筆画画像を抽出する方法を実行するように配置される。簡単にするために、ここでは第１の２値化処理サブ手段４０６２と、第１の細い筆画画像取得サブ手段４０６４と、第２の細い筆画画像取得サブ手段４０６６と、第２の２値化処理サブ手段４０６８と、第１の太い筆画画像取得サブ手段４０６１０と、第２の太い筆画画像取得サブ手段４０６１２とを具体的に説明しない。

また、選択的に、筆画画像取得手段４０６’は、フィルタリングサブ手段（図示せず）を更に備えても良い。フィルタリングサブ手段は、予め設けられたフィルタリング条件を利用して第１の太い筆画エッジ画像データと第２の太い筆画エッジデータにおける、連通領域に関するデータにフィルタリング処理を行って、予め設けられたフィルタリング条件を満足する第１の連通領域の画像データと第２の連通領域の画像データを取得するように配置される。

予め設けられたフィルタリング条件は、前記連通領域内の画素の階調分散が予め設けられた分散閾値によりも小さいである条件と、前記連通領域の内側エッジから外側エッジまでの画素極性が一致である条件と、前記連通領域の大きさが予め設けられた大きさの閾値内にある条件と、のうちの少なくとも一つを含む。予め設けられたフィルタリング条件については、図３〜図１０を参照して説明されたため、ここでは説明を重複しない。

本発明の実施の形態に係る、画像からテキスト筆画画像を抽出する方法及び装置により、少なくとも以下の技術的効果の一つを実現することができる。即ち、スピードが速くなる効果、及び、筆画の抽出と同時に処理されるビデオの悪品質に起因したノイズと筆画尺度に対する不敏感を抑制できる効果である。また、本発明の実施の形態に係る、画像からテキスト筆画画像を抽出する方法及び装置には、テキストの色、テキスト背景のコントラスト等の従来の知識の必要が無くなる。

以上に具体的な実施の形態を用いて本発明の基本的な原理を説明したが、本発明の方法及び装置の全て、或は任意のステップ又は構成要素をいかなる演算装置(プロセッサ、記憶媒体等を含む)又は演算装置のネットワークにおいてハードウェア、ファームウェア、ソフトウェア又はそれらの組合せで実現可能であることを当業者は理解することができる。これは、本発明の説明を検討した場合に、当業者により基本的なプログラミングスキルで実現可能である。

したがって、本発明の目的は更に、いかなる演算装置で一つのプログラム又は一組のプログラムを実行することで実現可能である。前記の演算装置は周知の汎用装置であっても良い。したがって、本発明の目的は、前記方法又は装置を実現するプログラムコードを含むプログラム製品を提供するだけで実現可能である。つまり、このようなプログラム製品と、このようなプログラム製品を記憶する媒体も本発明を構成する。勿論、前記の記憶媒体は、既に知られているか又は将来的に開発される任意の種類の記憶媒体であっても良い。

ソフトウェア及び/又はファームウェアにより本発明の実施の形態を実現する場合に、記憶媒体又はネットワークから専用のハードウェア構成を有するコンピュータ、例えば図１３に示された汎用のコンピュータ１２００へ当該ソフトウェアを構成するプログラムをインストールする。当該コンピュータは、各種のプログラムがインストールされている場合に、各機能などを実行することができる。

図１３において、中央処理装置（CPU）１２０１は、読取専用メモリ（ROM）１２０２に記憶されたプログラム又は記憶部１２０８からランダムアクセスメモリ（RAM）１２０３にロードされたプログラムに基づいて各種の処理を実行する。RAM１２０３には、必要に応じてCPU１２０１が各種の処理等を実行するために必要なデータも記憶されている。CPU１２０１、ROM１２０２とRAM１２０３は、バス１２０４を介して互いに接続されている。入力／出力インタフェース１２０５もバス１２０４に接続されている。

入力部１２０６(キーボード、マウス等を含む)と、出力部１２０７（ディスプレイ、例えばブラウン管（CRT）、液晶ディスプレイ（LCD）等とスピーカ等を含む）と、記憶部１２０８（ハードディスク等を含）と、通信部１２０９（ネットワークインターフェースカード、例えばLANカード、モデム等を含む）とは、入力／出力インタフェース１２０５に接続されている。通信部１２０９はネットワーク、例えばインターネットを経由して通信処理を実行する。必要に応じて、入力／出力インタフェース１２０５にはドライバ１２１０も接続されている。磁気ディスク、光ディスク、光磁気ディスク、半導体メモリ等のような取り外し可能な媒体１２１１は、必要に応じてドライバ１２１０に装着される。これにより、読み出されたコンピュータプログラムが必要に応じて記憶部１２０８にインストールされる。

ソフトウェアで前記一連の処理を実現する場合に、ネットワーク、例えばインターネット、又は記憶媒体、例えば取外し可能な媒体１２１１からソフトウェアを構成するプログラムをインストールする。

このような記憶媒体は、図１３に示された、その中にプログラムが記憶されており、デバイスから離れて配送されてユーザにプログラムを提供する取り外し可能な媒体１２１１に限定されないことを、当業者が理解すべきである。取り外し可能な媒体１２１１として、例えば、磁気ディスク（フロッピディスク（登録商標）含む）、光ディスク（コンパクトディスクリードオンリーメモリ（CD−ROM）やデジタルバーサティルディスク（DVD）を含む）、光磁気ディスク（ミニディスク(MD)（登録商標）含む）及び半導体メモリを含む。或いは、記憶媒体は、ROM１２０２、記憶部１２０８に含まれるハードディスクであって、プログラムが記憶されており、且つそれらを含むデバイスと一緒にユーザに配送されるハードディスクなどであっても良い。

本発明は、更にコンピュータが読取り可能なコマンドコードを記憶するプログラムプロダクトを開示した。コマンドコードは、コンピュータにより読取られて実行されると、上述された本発明の実施の形態に係る方法を実行することができる。

一方、上記のコンピュータ読取り可能なコマンドコードを記憶するプログラムプロダクトを保持する記憶媒体も本発明の開示に含まれる。記憶媒体は、フロプティカルディスク、光ディスク、光磁気ディスク、メモリカード、メモリスティック等を含むが、それらに限定されない。

当業者は、ここで列挙されたのは例示的なものであり、本発明に限定しないことについて理解すべきである。

本明細書において、「第１」、「第２」及び「第Ｎ個」等の記述は、説明された特徴を文字上で区別して本発明を明瞭に説明するためのものである。従って、それはいかなる限定的な意味を有するものではない。

上記方法の各ステップ及び上記装置の各構成モジュール及び/又は手段は、例示として、ソフトウェア、ファームウェア、ハードウェア又はその組み合わせとして実施し、且つ相応の装置における一部とすることができる。上記装置における各構成モジュール、手段がソフトウェア、ファームウェア、ハードウェア又はその組み合わせの形態で配置される時に使用可能な具体的な方法又は形態は、当業者に周知されたため、ここでは詳しく説明しない。

ソフトウェア又はファームウェアで実現される場合に、例示として、記憶媒体又はネットワークから専用のハードウェア構成を有するコンピュータ（例えば図１３に示された汎用のコンピュータ１２００）へ当該ソフトウェアを構成するプログラムをインストールすることができる。当該コンピュータは、各種のプログラムがインストールされている場合に、各機能などを実行することができる。

以上、本発明の具体的な実施の形態に対する説明において、一種の実施の形態について説明及び/又は図示した特徴は、同一又は類似した形態で、一つ又は複数のその他の実施の形態で使用され、その他の実施の形態における特徴と組み合わせ、或いはその他の実施の形態における特徴を置換することができる。

強調すべきは、専門用語「備える/含む」は本明細書に使用される時に特徴、要素、ステップ又は構成要素の存在を指すが、一つ又は複数のその他の特徴、要素、ステップ又は構成要素の存在又は付加を排除するわけではない。

また、本発明の方法は、明細書に説明された時間順で実行されることに限定されず、その他の時間に従って順次に、並行に又は個別に実行されでも良い。したがって、本明細書に説明された方法の実行順は、本発明の技術的範囲を限定するものではない。

以上のように、本発明の具体的な実施の形態の説明により本発明を開示したが、当業者は以下に付記される本願発明の要旨と範囲内に本発明に対する様々な変更、改善又は同等物を設計することができる。これら変更、改善又は同等物は、本発明の保護範囲内に含まれるものと認めるべきである。
（付記）
（付記１）
画像からテキスト筆画画像を抽出する方法であって、
前記画像のエッジ情報と勾配情報を取得するステップと、
取得されたエッジ情報と勾配情報に予め設けられた強調処理を行うことにより、前記画像においてテキストに関するエッジ情報と勾配情報を強調するステップと、
強調されたエッジ情報と勾配情報に対応するテキスト筆画画像を取得するステップと、
を含むことを特徴とする方法。
（付記２）
前記画像のエッジ情報と勾配情報を取得するステップは、
前記画像のエッジ情報と勾配情報を代表するステップ信号又はパルス信号を解析し、解析結果に基づいて前記エッジ情報と前記勾配情報を抽出することを含む、
付記１記載の方法。
（付記３）
前記画像のエッジ情報と勾配情報を取得するステップは、
画像の複数の方向におけるエッジ情報と勾配情報を取得するための複数のソーベル演算子のコンボリューションカーネルを利用して、前記画像の画像データと畳み込み演算をそれぞれ行い、
各方向に対する畳み込み演算の結果を各方向に対する正パルス応答画像データと負パルス応答画像データに区分することを含み、
前記画像においてテキストに関するエッジ情報と勾配情報を強調するステップは、
各方向に対する正パルス応答画像データと負パルス応答画像データに、対向する方向へのオフセット及び加算を実行して、各方向に対する第１の合成画像データを取得し、及び/又は、
各方向に対する正パルス応答画像データと負パルス応答画像データに、反対の方向へのオフセット及び加算を実行して、各方向に対する第２の合成画像データを取得することを含み、
前記強調されたエッジ情報と勾配情報に対応するテキスト筆画画像を取得するステップは、
予め設けられた第１の閾値を用いて各方向に対する第１の合成画像データ及び/又は第２の合成画像データに第１の２値化処理をそれぞれ行い、第１の２値化処理が行われた、各方向に対する第１の合成画像データに整合処理を行って第１の細い筆画画像データを取得することにより、前記第１の細い筆画画像データに対応する第１の細い筆画画像を取得し、及び/又は、第１の２値化処理が行われた、各方向に対する第２の合成画像データに整合処理を行って、対応する第２の細い筆画画像データを取得することにより、前記第２の細い筆画画像データに対応する第２の細い筆画画像を取得し、及び/又は、
予め設けられた、第１の閾値よりも小さい第２の閾値を用いて各方向に対する第１の合成画像データ及び/又は第２の合成画像データに第２の２値化処理をそれぞれ行い、第２の２値化処理が行われた、各方向に対する第１の合成画像データに整合処理を行って第１の太い筆画画像データを取得することにより、前記第１の太い筆画画像データに対応する第１の太い筆画画像を取得し、及び/又は、第２の２値化処理が行われた、各方向に対する第２の合成画像データに整合処理を行って、対応する第２の太い筆画画像データを取得することにより、前記第２の太い筆画画像データに対応する第２の太い筆画画像を取得することを含む、
付記２記載の方法。
（付記４）
前記整合処理は、和集合を求める処理と、最大値を求める処理と、平均値を求める処理との何れかを含む、
付記３記載の方法。
（付記５）
前記画像の複数の方向におけるエッジ情報と勾配情報を取得するための複数のソーベル演算子のコンボリューションカーネルを利用して前記画像の画像データと畳み込み演算をそれぞれ行うステップは、
画像の横方向、縦方向及び二つの対角線方向の四つの方向におけるエッジ情報と勾配情報を取得するための四つのソーベル演算子のコンボリューションカーネルを利用して前記画像の画像データと畳み込み演算をそれぞれ行うことを含む、
付記３又は４記載の方法。
（付記６）
前記対向する方向へのオフセット及び加算は、以下の式
I_h(x,y)=(I_h-positive(x,y-w/2)+I_h-negative(x,y+w/2))/2、
I_v(x,y)=(I_v-positive(x-w/2,y)+I_v-negative(x+w/2,y))/2、
I_rd(x,y)=(I_rd-positive(x+w/2,y-w/2)+I_rd-negative(x-w/2,y+w/2))/2、及び
I_ld(x,y)=(I_ld-positive(x-w/2,y-w/2)+I_ld-negative(x+w/2,y+w/2))/2、
に基づいて行われ、
前記の反対の方向へのオフセット及び加算は、以下の式
I_h’(x,y)=(I_h-positive(x,y+w/2)+I_h-negative(x,y-w/2))/2、
I_v’(x,y)=(I_v-positive(x+w/2,y)+I_v-negative(x-w/2,y))/2、
I_rd’(x,y)=(I_rd-positive(x-w/2,y+w/2)+I_rd-negative(x+w/2,y-w/2))/2、及び
I_ld’(x,y)=(I_ld-positive(x+w/2,y+w/2)+I_ld-negative(x-w/2,y-w/2))/2、
に基づいて行われ、
xは画素の横座標、yは前記画素の縦座標、I_h(x,y)、I_v(x,y)、I_rd(x,y)とI_ld(x,y)は前記画素の横方向、縦方向、及び二つの対角線方向の四つの方向に対する第１の合成画像データをそれぞれ示し、
I_h’(x,y)、I_v’(x,y)、I_rd’(x,y)及びI_ld’(x,y)は、前記画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する第２の合成画像データをそれぞれ示し、
I_h-positive(x,y)、I_v-positive(x,y)、I_rd-positive(x,y)及びI_ld-positive(x,y)は、前記画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する正パルス応答画像データをそれぞれ示し、
I_h-negative(x,y)、I_v-negative(x,y)、I_rd-negative(x,y)及びI_ld-negative(x,y)は、前記画素の横方向、縦方向及び二つの対角線方向の四つの方法に対する負パルス応答画像データをそれぞれ示し、wは予め推定された筆画幅である、
付記３乃至５の何れか記載の方法。
（付記７）
前記第１の太い筆画画像データと前記第２の太い筆画画像データにそれぞれ対応する第１の太い筆画画像と第２の太い筆画画像を取得するステップは、
予め設けられたフィルタリング条件を利用して前記第１の太い筆画画像データと前記第２の太い筆画画像データにおける連通領域データにフィルタリング処理をそれぞれ行うことにより、前記予め設けられたフィルタリング条件を満たす第１の連通領域の画像データと第２の連通領域の画像データを取得し、
前記第１の連通領域の画像データと前記第２の連通領域の画像データにそれぞれ対応する第１の太い筆画画像と第２の太い筆画画像を取得することを含む、
付記３乃至６の何れか記載の方法。
（付記８）
前記予め設けられたフィルタリング条件は、少なくとも、
前記連通領域内の画素の階調分散が予め設けられた分散の閾値よりも小さい条件と、
前記連通領域内の内側エッジから外側エッジまでの画素極性が一致する条件と、
前記連通領域の大きさが予め設けられた大きさの閾値内にある条件と、
のうちの一つを含む、
付記７記載の方法。
（付記９）
テキスト筆画の精度とテキスト筆画のリコールレートとのうちの少なくとも一つに基づいて、前記第１の細い筆画画像と前記第２の細い筆画画像の何れかを最終的な細い筆画画像として選別し、及び/又は、前記第１の太い筆画画像と前記第２の太い筆画画像の何れかを最終的な太い筆画画像として選別することを更に含む、
付記３乃至８の何れか記載の方法。
（付記１０）
画像からテキスト筆画画像を抽出する装置であって、
前記画像のエッジ情報と勾配情報を取得する情報取得手段と、
取得されたエッジ情報と勾配情報に予め設けられた強調処理を行うことにより、前記画像においてテキストに関するエッジ情報と勾配情報を強調する強調手段と、
強調されたエッジ情報と勾配情報に対応するテキスト筆画画像を取得する筆画画像取得手段と、
を備えることを特徴とする装置。
（付記１１）
前記情報取得手段は、前記画像のエッジ情報と勾配情報を代表するステップ信号又はパルス信号を解析し、解析結果に基づいて前記エッジ情報と前記勾配情報を抽出する、
付記１０記載の装置。
（付記１２）
前記情報取得手段は、
画像の複数の方向におけるエッジ情報と勾配情報を取得するための複数のソーベル演算子のコンボリューションカーネルを利用して、前記画像の画像データと畳み込み演算をそれぞれ行う畳み込み演算サブ手段と、
各方向に対する畳み込み演算の結果を各方向に対する正パルス応答画像データと負パルス応答画像データに区分する区分サブ手段とを備え、
前記強調手段は、
各方向に対する正パルス応答画像データと負パルス応答画像データに、対向する方向へのオフセット及び加算を実行して、各方向に対する第１の合成画像データを取得する第１の合成画像取得サブ手段、及び/又は、
各方向に対する正パルス応答画像データと負パルス応答画像データに、反対の方向へのオフセット及び加算を実行して、各方向に対する第２の合成画像データを取得する第２の合成画像取得サブ手段を備え、
前記筆画画像取得手段は、
予め設けられた第１の閾値を用いて各方向に対する第１の合成画像データ及び/又は第２の合成画像データに第１の２値化処理をそれぞれ行う第１の２値化処理サブ手段と、第１の２値化処理が行われた、各方向に対する第１の合成画像データに整合処理を行って第１の細い筆画画像データを取得することにより、前記第１の細い筆画画像データに対応する第１の細い筆画画像を取得する第１の細い筆画画像取得サブ手段と、及び/又は、第１の２値化処理が行われた、各方向に対する第２の合成画像データに整合処理を行って、対応する第２の細い筆画画像データを取得することにより、前記第２の細い筆画画像データに対応する第２の細い筆画画像を取得する第２の細い筆画画像取得サブ手段と、及び/又は、
予め設けられた、第１の閾値よりも小さい第２の閾値を用いて各方向に対する第１の合成画像データ及び/又は第２の合成画像データに第２の２値化処理をそれぞれ行う第２の２値化処理サブ手段と、第２の２値化処理が行われた、各方向に対する第１の合成画像データに整合処理を行って第１の太い筆画画像データを取得することにより、前記第１の太い筆画画像データに対応する第１の太い筆画画像を取得する第１の太い筆画画像取得サブ手段と、及び/又は、第２の２値化処理が行われた、各方向に対する第２の合成画像データに整合処理を行って、対応する第２の太い筆画画像データを取得することにより、前記第２の太い筆画画像データに対応する第２の太い筆画画像を取得する第２の太い筆画画像取得サブ手段とを備える、
付記１１記載の装置。
（付記１３）
前記整合処理は、和集合を求める処理と、最大値を求める処理と、平均値を求める処理との何れかを含む、
付記１２記載の装置。
（付記１４）
前記畳み込み演算サブ手段は、画像の横方向、縦方向及び二つの対角線方向の四つの方向におけるエッジ情報と勾配情報を取得するための四つのソーベル演算子のコンボリューションカーネルを利用して前記画像の画像データと畳み込み演算をそれぞれ行う、付記１２又は１３記載の装置。
（付記１５）
前記対向する方向へのオフセット及び加算は、以下の式
I_h(x,y)=(I_h-positive(x,y-w/2)+I_h-negative(x,y+w/2))/2、
I_v(x,y)=(I_v-positive(x-w/2,y)+I_v-negative(x+w/2,y))/2、
I_rd(x,y)=(I_rd-positive(x+w/2,y-w/2)+I_rd-negative(x-w/2,y+w/2))/2、及び
I_ld(x,y)=(I_ld-positive(x-w/2,y-w/2)+I_ld-negative(x+w/2,y+w/2))/2、
に基づいて行われ、
前記の反対する方向へのオフセット及び加算は、以下の式
I_h’(x,y)=(I_h-positive(x,y+w/2)+I_h-negative(x,y-w/2))/2、
I_v’(x,y)=(I_v-positive(x+w/2,y)+I_v-negative(x-w/2,y))/2、
I_rd’(x,y)=(I_rd-positive(x-w/2,y+w/2)+I_rd-negative(x+w/2,y-w/2))/2、及び
I_ld’(x,y)=(I_ld-positive(x+w/2,y+w/2)+I_ld-negative(x-w/2,y-w/2))/2、
に基づいて行われ、
xは画素の横座標、yは前記画素の縦座標、I_h(x,y)、I_v(x,y)、I_rd(x,y)及びI_ld(x,y)は、前記画素の横方向、縦方向、及び二つの対角線方向の四つの方向に対する第１の合成画像データをそれぞれ示し、
I_h’(x,y)、I_v’(x,y)、I_rd’(x,y)及びI_ld’(x,y)は、前記画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する第２の合成画像データをそれぞれ示し、
I_h-positive(x,y)、I_v-positive(x,y)、I_rd-positive(x,y)及びI_ld-positive(x,y)は、前記画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する正パルス応答画像データをそれぞれ示し、
I_h-negative(x,y)、I_v-negative(x,y)、I_rd-negative(x,y)及びI_ld-negative(x,y)は、前記画素の横方向、縦方向及び二つの対角線方向の四つの方法に対する負パルス応答画像データをそれぞれ示し、wは予め推定された筆画幅である、
付記１２乃至１４の何れか記載の装置。
（付記１６）
前記筆画画像取得手段は、更に、予め設けられたフィルタリング条件を利用して前記第１の太い筆画画像データと前記第２の太い筆画画像データにおける連通領域データにフィルタリング処理をそれぞれ行うことにより、前記予め設けられたフィルタリング条件を満たす第１の連通領域の画像データと第２の連通領域の画像データを取得するフィルタリングサブ手段を備える、
付記１２乃至１５の何れか記載の装置。
（付記１７）
前記予め設けられたフィルタリング条件は、少なくとも、前記連通領域内の画素の階調分散が予め設けられた分散の閾値よりも小さい条件と、前記連通領域内の内側エッジから外側エッジまでの画素極性が一致である条件と、前記連通領域の大きさが予め設けられた大きさの閾値内にある条件と、のうちの一つを含む、
付記１６記載の装置。
（付記１８）
テキスト筆画の精度とテキスト筆画のリコールレートとのうちの少なくとも一つに基づいて、前記第１の細い筆画画像と前記第２の細い筆画画像の何れかを最終的な細い筆画画像として選別し、及び/又は、前記第１の太い筆画画像と前記第２の太い筆画画像の何れかを最終的な太い筆画画像として選別する選別手段を更に備える、
付記１２乃至１７の何れか記載の装置。
（付記１９）
コンピュータに、付記１乃至９の何れか記載の、画像からテキスト筆画画像を抽出する方法を実行させるための命令を含むコンピュータプログラム。
（付記２０）
付記１９記載のコンピュータプログラムを記録したコンピュータ読み取り可能な記録媒体。

４００：画像からテキスト筆画画像を抽出する装置
４０２：情報取得手段
４０４：強調手段
４０６：筆画画像取得手段
４００’：画像からテキスト筆画画像を抽出する装置
４０２’：情報取得手段
４０２２：畳込み演算サブ手段
４０２４：区分サブ手段
４０４’：強調手段
４０４２：第１の合成画像取得サブ手段
４０４４：第２の合成画像取得サブ手段
４０６’：筆画画像取得手段
４０６２：第１の２値化処理サブ手段
４０６４：第１の細い筆画画像取得サブ手段
４０６６：第２の細い筆画画像取得サブ手段
４０６８：第２の２値化処理サブ手段
４０６１０：第１の太い筆画画像取得サブ手段
４０６１２：第２の太い筆画画像取得サブ手段

Claims

画像からテキスト筆画画像を抽出する方法をコンピュータに実行させるコンピュータプログラムであって、前記方法は、
前記画像のエッジ情報と勾配情報を取得するステップであって、画像データに含まれるステップ信号と所定の演算子に対応する信号を用いて第１のエッジ情報と第１の勾配情報を取得し、前記画像データに含まれるパルス信号と前記所定の演算子に対応する信号を用いて第２のエッジ情報と第２の勾配情報を取得する、ステップと、
取得されたエッジ情報と勾配情報に予め設けられた強調処理を行うことにより、前記画像においてテキストに関するエッジ情報と勾配情報を強調するステップと、
強調されたエッジ情報と勾配情報に対応するテキスト筆画画像を取得するステップと、
を含むことを特徴とするコンピュータプログラム。
前記画像のエッジ情報と勾配情報を取得するステップは、
前記画像のエッジ情報と勾配情報を代表する前記ステップ信号及び前記パルス信号を解析し、解析結果に基づいて前記第１及び第２のエッジ情報と前記第１及び第２の勾配情報を抽出することを含む、
請求項１記載のコンピュータプログラム。
前記画像のエッジ情報と勾配情報を取得するステップは、
画像の複数の方向におけるエッジ情報と勾配情報を取得するための複数のソーベル演算子のコンボリューションカーネルを利用して、前記画像の画像データと畳み込み演算をそれぞれ行い、
各方向に対する畳み込み演算の結果を各方向に対する正パルス応答画像データと負パルス応答画像データに区分することを含み、
前記画像においてテキストに関するエッジ情報と勾配情報を強調するステップは、
各方向に対する正パルス応答画像データと負パルス応答画像データに、対向する方向へのオフセット及び加算を実行して、各方向に対する第１の合成画像データを取得し、及び/又は、
各方向に対する正パルス応答画像データと負パルス応答画像データに、反対の方向へのオフセット及び加算を実行して、各方向に対する第２の合成画像データを取得することを含み、
前記強調されたエッジ情報と勾配情報に対応するテキスト筆画画像を取得するステップは、
予め設けられた第１の閾値を用いて各方向に対する第１の合成画像データ及び/又は第２の合成画像データに第１の２値化処理をそれぞれ行い、第１の２値化処理が行われた、各方向に対する第１の合成画像データに整合処理を行って第１の細い筆画画像データを取得することにより、前記第１の細い筆画画像データに対応する第１の細い筆画画像を取得し、及び/又は、第１の２値化処理が行われた、各方向に対する第２の合成画像データに整合処理を行って、対応する第２の細い筆画画像データを取得することにより、前記第２の細い筆画画像データに対応する第２の細い筆画画像を取得し、及び/又は、
予め設けられた、第１の閾値よりも小さい第２の閾値を用いて各方向に対する第１の合成画像データ及び/又は第２の合成画像データに第２の２値化処理をそれぞれ行い、第２の２値化処理が行われた、各方向に対する第１の合成画像データに整合処理を行って第１の太い筆画画像データを取得することにより、前記第１の太い筆画画像データに対応する第１の太い筆画画像を取得し、及び/又は、第２の２値化処理が行われた、各方向に対する第２の合成画像データに整合処理を行って、対応する第２の太い筆画画像データを取得することにより、前記第２の太い筆画画像データに対応する第２の太い筆画画像を取得することを含む、
請求項２記載のコンピュータプログラム。
前記整合処理は、和集合を求める処理と、最大値を求める処理と、平均値を求める処理との何れかを含む、
請求項３記載のコンピュータプログラム。
前記画像の複数の方向におけるエッジ情報と勾配情報を取得するための複数のソーベル演算子のコンボリューションカーネルを利用して前記画像の画像データと畳み込み演算をそれぞれ行うステップは、
画像の横方向、縦方向及び二つの対角線方向の四つの方向におけるエッジ情報と勾配情報を取得するための四つのソーベル演算子のコンボリューションカーネルを利用して前記画像の画像データと畳み込み演算をそれぞれ行うことを含む、
請求項３又は４記載のコンピュータプログラム。
前記対向する方向へのオフセット及び加算は、以下の式
I_h(x, y) = (I_h-positive(x, y-w/2) + I_h-negative(x, y+w/2))/2、
I_v(x, y) = (I_v-positive(x-w/2, y) + I_v-negative(x+w/2, y))/2、
I_rd(x, y) = (I_rd-positive(x+w/2, y-w/2) + I_rd-negative(x-w/2, y+w/2))/2、及び
I_ld(x, y) = (I_ld-positive(x-w/2, y-w/2) + I_ld-negative(x+w/2, y+w/2))/2、
に基づいて行われ、
前記の反対の方向へのオフセット及び加算は、以下の式
I_h’(x, y) = (I_h-positive(x, y+w/2) + I_h-negative(x, y-w/2))/2、
I_v’(x, y) = (I_v-positive(x+w/2, y) + I_v-negative(x-w/2, y))/2、
I_rd’(x, y) = (I_rd-positive(x-w/2, y+w/2) + I_rd-negative(x+w/2, y-w/2))/2、及び
I_ld’(x, y) = (I_ld-positive(x+w/2, y+w/2) + I_ld-negative(x-w/2, y-w/2))/2、
に基づいて行われ、
xは画素の横座標、yは前記画素の縦座標、I_h(x, y)、I_v(x, y)、I_rd(x, y)とI_ld(x, y)は前記画素の横方向、縦方向、及び二つの対角線方向の四つの方向に対する第１の合成画像データをそれぞれ示し、
I_h’(x, y)、I_v’(x, y)、I_rd’(x, y)及びI_ld’(x, y)は、前記画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する第２の合成画像データをそれぞれ示し、
I_h-positive(x, y)、I_v-positive(x, y)、I_rd-positive(x, y)及びI_ld-positive(x, y)は、前記画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する正パルス応答画像データをそれぞれ示し、
I_h-negative(x, y)、I_v-negative(x, y)、I_rd-negative(x, y)及びI_ld-negative(x, y)は、前記画素の横方向、縦方向及び二つの対角線方向の四つの方法に対する負パルス応答画像データをそれぞれ示し、wは予め推定された筆画幅である、
請求項３乃至５の何れか記載のコンピュータプログラム。
前記第１の太い筆画画像データと前記第２の太い筆画画像データにそれぞれ対応する第１の太い筆画画像と第２の太い筆画画像を取得するステップは、
予め設けられたフィルタリング条件を利用して前記第１の太い筆画画像データと前記第２の太い筆画画像データにおける連通領域データにフィルタリング処理をそれぞれ行うことにより、前記予め設けられたフィルタリング条件を満たす第１の連通領域の画像データと第２の連通領域の画像データを取得し、
前記第１の連通領域の画像データと前記第２の連通領域の画像データにそれぞれ対応する第１の太い筆画画像と第２の太い筆画画像を取得することを含む、
請求項３乃至６の何れか記載のコンピュータプログラム。
前記予め設けられたフィルタリング条件は、少なくとも、
前記連通領域内の画素の階調分散が予め設けられた分散の閾値よりも小さい条件と、
前記連通領域内の内側エッジから外側エッジまでの画素極性が一致する条件と、
前記連通領域の大きさが予め設けられた大きさの閾値内にある条件と、
のうちの一つを含む、
請求項７記載のコンピュータプログラム。
テキスト筆画の精度とテキスト筆画のリコールレートとのうちの少なくとも一つに基づいて、前記第１の細い筆画画像と前記第２の細い筆画画像の何れかを最終的な細い筆画画像として選別し、及び/又は、前記第１の太い筆画画像と前記第２の太い筆画画像の何れかを最終的な太い筆画画像として選別することを更に含む、
請求項３乃至８の何れか記載のコンピュータプログラム。
画像からテキスト筆画画像を抽出する装置であって、
前記画像のエッジ情報と勾配情報を取得する情報取得手段であって、画像データに含まれるステップ信号と所定の演算子に対応する信号を用いて第１のエッジ情報と第１の勾配情報を取得し、前記画像データに含まれるパルス信号と前記所定の演算子に対応する信号を用いて第２のエッジ情報と第２の勾配情報を取得する、情報取得手段と、
取得されたエッジ情報と勾配情報に予め設けられた強調処理を行うことにより、前記画像においてテキストに関するエッジ情報と勾配情報を強調する強調手段と、
強調されたエッジ情報と勾配情報に対応するテキスト筆画画像を取得する筆画画像取得手段と、
を備えることを特徴とする装置。