JP5939023B2 - コンピュータプログラム及び画像抽出装置 - Google Patents
コンピュータプログラム及び画像抽出装置 Download PDFInfo
- Publication number
- JP5939023B2 JP5939023B2 JP2012110573A JP2012110573A JP5939023B2 JP 5939023 B2 JP5939023 B2 JP 5939023B2 JP 2012110573 A JP2012110573 A JP 2012110573A JP 2012110573 A JP2012110573 A JP 2012110573A JP 5939023 B2 JP5939023 B2 JP 5939023B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- image data
- stroke
- thick
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Character Input (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Description
上記した課題を解決しうる、画像からテキスト筆画画像を抽出する方法及び装置が望まれる。
本発明は、画像からテキスト筆画画像を抽出する方法及び装置を提供することを目的とする。
図1は、本発明の実施の形態に係る、画像からテキスト筆画画像を抽出する方法を示すフローチャートである。図1に示されたように、ステップS102において、画像のエッジ情報及び勾配情報を取得することができる。
好ましくは、画像のエッジ情報及び勾配情報を表すステップ信号又はパルス信号を解析し、解析結果に基づいてエッジ情報と勾配情報を抽出することができる。
(外1)
に対応するからである。
Ih(x,y)=(Ih-positive(x,y-w/2)+Ih-negative(x,y+w/2))/2
Iv(x,y)=(Iv-positive(x-w/2,y)+Iv-negative(x+w/2,y))/2
Ird(x,y)=(Ird-positive(x+w/2,y-w/2)+Ird-negative(x-w/2,y+w/2))/2
Ild(x,y)=(Ild-positive(x-w/2,y-w/2)+Ild-negative(x+w/2,y+w/2))/2
また、反対の方向にオフセットし、かつ、加算する演算が以下の(2)式に基づいて実行されても良い。
Iv’(x,y)=(Iv-positive(x+w/2,y)+Iv-negative(x-w/2,y))/2,
Ird’(x,y)=(Ird-positive(x-w/2,y+w/2)+Ird-negative(x+w/2,y-w/2))/2,
Ild’(x,y)=(Ild-positive(x+w/2,y+w/2)+Ild-negative(x-w/2,y-w/2))/2
なお、xは画素の横座標、yは画素の縦座標、Ih(x,y)、Iv(x,y)、Ird(x,y)及びIld(x,y)は画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する第1の合成画像データをそれぞれ示す。なお、第1の合成画像データを含む画像は、図5A〜5Dに示される。
I’output-thin=I’h-binarized-high∪I’v-binarized-high∪I’rd-binarized-high∪I’ld-binarized-high
なお、Ioutput-thinは、和集合が求められた第1の細い筆画画像データであり、Ih-binarized-high、Iv-binarized-high、Ird-binarized-high及びIld-binarized-highのそれぞれは、第1の合成画像データIh(x,y)、Iv(x,y)、Ird(x,y)及びIld(x,y)に高い閾値による2値化処理を行った2値化画像データである。なお、I’output-thinは、和集合が求められた第2の細い筆画画像データであり、I’h-binarized-high、I’v-binarized-high、I’rd-binarized-high及びI’ld-binarized-highのそれぞれは、第2の合成画像データIh’(x,y)、Iv’(x,y)、Ird’(x,y)及びIld’(x,y)に高い閾値による2値化処理を行った2値化画像データである。
Ioutput-thick=Ih-binarized-low∪Iv-binarized-low∪Ird-binarized-low∪Ild-binarized-low
I’output-thick=I’h-binarized-low∪I’v-binarized-low∪I’rd-binarized-low∪I’ld-binarized-low
なお、Ioutput-thickは、和集合が求められた第1の太い筆画画像データであり、Ih-binarized-low、Iv-binarized-low、Ird-binarized-low及びIld-binarized-lowのそれぞれは、第1の合成画像データIh(x,y)、Iv(x,y)、Ird(x,y)及びIld(x,y)に低い閾値による2値化処理を行った2値化画像データである。なお、I’output-thickは、和集合が求められた第2の太い筆画画像データであり、I’h-binarized-low、I’v-binarized-low、I’rd-binarized-low及びI’ld-binarized-lowのそれぞれは、第2の合成画像データIh’(x,y)、Iv’(x,y)、Ird’(x,y)及びIld’(x, y)に低い閾値による2値化処理を行った2値化画像データである。
(付記)
(付記1)
画像からテキスト筆画画像を抽出する方法であって、
前記画像のエッジ情報と勾配情報を取得するステップと、
取得されたエッジ情報と勾配情報に予め設けられた強調処理を行うことにより、前記画像においてテキストに関するエッジ情報と勾配情報を強調するステップと、
強調されたエッジ情報と勾配情報に対応するテキスト筆画画像を取得するステップと、
を含むことを特徴とする方法。
(付記2)
前記画像のエッジ情報と勾配情報を取得するステップは、
前記画像のエッジ情報と勾配情報を代表するステップ信号又はパルス信号を解析し、解析結果に基づいて前記エッジ情報と前記勾配情報を抽出することを含む、
付記1記載の方法。
(付記3)
前記画像のエッジ情報と勾配情報を取得するステップは、
画像の複数の方向におけるエッジ情報と勾配情報を取得するための複数のソーベル演算子のコンボリューションカーネルを利用して、前記画像の画像データと畳み込み演算をそれぞれ行い、
各方向に対する畳み込み演算の結果を各方向に対する正パルス応答画像データと負パルス応答画像データに区分することを含み、
前記画像においてテキストに関するエッジ情報と勾配情報を強調するステップは、
各方向に対する正パルス応答画像データと負パルス応答画像データに、対向する方向へのオフセット及び加算を実行して、各方向に対する第1の合成画像データを取得し、及び/又は、
各方向に対する正パルス応答画像データと負パルス応答画像データに、反対の方向へのオフセット及び加算を実行して、各方向に対する第2の合成画像データを取得することを含み、
前記強調されたエッジ情報と勾配情報に対応するテキスト筆画画像を取得するステップは、
予め設けられた第1の閾値を用いて各方向に対する第1の合成画像データ及び/又は第2の合成画像データに第1の2値化処理をそれぞれ行い、第1の2値化処理が行われた、各方向に対する第1の合成画像データに整合処理を行って第1の細い筆画画像データを取得することにより、前記第1の細い筆画画像データに対応する第1の細い筆画画像を取得し、及び/又は、第1の2値化処理が行われた、各方向に対する第2の合成画像データに整合処理を行って、対応する第2の細い筆画画像データを取得することにより、前記第2の細い筆画画像データに対応する第2の細い筆画画像を取得し、及び/又は、
予め設けられた、第1の閾値よりも小さい第2の閾値を用いて各方向に対する第1の合成画像データ及び/又は第2の合成画像データに第2の2値化処理をそれぞれ行い、第2の2値化処理が行われた、各方向に対する第1の合成画像データに整合処理を行って第1の太い筆画画像データを取得することにより、前記第1の太い筆画画像データに対応する第1の太い筆画画像を取得し、及び/又は、第2の2値化処理が行われた、各方向に対する第2の合成画像データに整合処理を行って、対応する第2の太い筆画画像データを取得することにより、前記第2の太い筆画画像データに対応する第2の太い筆画画像を取得することを含む、
付記2記載の方法。
(付記4)
前記整合処理は、和集合を求める処理と、最大値を求める処理と、平均値を求める処理との何れかを含む、
付記3記載の方法。
(付記5)
前記画像の複数の方向におけるエッジ情報と勾配情報を取得するための複数のソーベル演算子のコンボリューションカーネルを利用して前記画像の画像データと畳み込み演算をそれぞれ行うステップは、
画像の横方向、縦方向及び二つの対角線方向の四つの方向におけるエッジ情報と勾配情報を取得するための四つのソーベル演算子のコンボリューションカーネルを利用して前記画像の画像データと畳み込み演算をそれぞれ行うことを含む、
付記3又は4記載の方法。
(付記6)
前記対向する方向へのオフセット及び加算は、以下の式
Ih(x,y)=(Ih-positive(x,y-w/2)+Ih-negative(x,y+w/2))/2、
Iv(x,y)=(Iv-positive(x-w/2,y)+Iv-negative(x+w/2,y))/2、
Ird(x,y)=(Ird-positive(x+w/2,y-w/2)+Ird-negative(x-w/2,y+w/2))/2、及び
Ild(x,y)=(Ild-positive(x-w/2,y-w/2)+Ild-negative(x+w/2,y+w/2))/2、
に基づいて行われ、
前記の反対の方向へのオフセット及び加算は、以下の式
Ih’(x,y)=(Ih-positive(x,y+w/2)+Ih-negative(x,y-w/2))/2、
Iv’(x,y)=(Iv-positive(x+w/2,y)+Iv-negative(x-w/2,y))/2、
Ird’(x,y)=(Ird-positive(x-w/2,y+w/2)+Ird-negative(x+w/2,y-w/2))/2、及び
Ild’(x,y)=(Ild-positive(x+w/2,y+w/2)+Ild-negative(x-w/2,y-w/2))/2、
に基づいて行われ、
xは画素の横座標、yは前記画素の縦座標、Ih(x,y)、Iv(x,y)、Ird(x,y)とIld(x,y)は前記画素の横方向、縦方向、及び二つの対角線方向の四つの方向に対する第1の合成画像データをそれぞれ示し、
Ih’(x,y)、Iv’(x,y)、Ird’(x,y)及びIld’(x,y)は、前記画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する第2の合成画像データをそれぞれ示し、
Ih-positive(x,y)、Iv-positive(x,y)、Ird-positive(x,y)及びIld-positive(x,y)は、前記画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する正パルス応答画像データをそれぞれ示し、
Ih-negative(x,y)、Iv-negative(x,y)、Ird-negative(x,y)及びIld-negative(x,y)は、前記画素の横方向、縦方向及び二つの対角線方向の四つの方法に対する負パルス応答画像データをそれぞれ示し、wは予め推定された筆画幅である、
付記3乃至5の何れか記載の方法。
(付記7)
前記第1の太い筆画画像データと前記第2の太い筆画画像データにそれぞれ対応する第1の太い筆画画像と第2の太い筆画画像を取得するステップは、
予め設けられたフィルタリング条件を利用して前記第1の太い筆画画像データと前記第2の太い筆画画像データにおける連通領域データにフィルタリング処理をそれぞれ行うことにより、前記予め設けられたフィルタリング条件を満たす第1の連通領域の画像データと第2の連通領域の画像データを取得し、
前記第1の連通領域の画像データと前記第2の連通領域の画像データにそれぞれ対応する第1の太い筆画画像と第2の太い筆画画像を取得することを含む、
付記3乃至6の何れか記載の方法。
(付記8)
前記予め設けられたフィルタリング条件は、少なくとも、
前記連通領域内の画素の階調分散が予め設けられた分散の閾値よりも小さい条件と、
前記連通領域内の内側エッジから外側エッジまでの画素極性が一致する条件と、
前記連通領域の大きさが予め設けられた大きさの閾値内にある条件と、
のうちの一つを含む、
付記7記載の方法。
(付記9)
テキスト筆画の精度とテキスト筆画のリコールレートとのうちの少なくとも一つに基づいて、前記第1の細い筆画画像と前記第2の細い筆画画像の何れかを最終的な細い筆画画像として選別し、及び/又は、前記第1の太い筆画画像と前記第2の太い筆画画像の何れかを最終的な太い筆画画像として選別することを更に含む、
付記3乃至8の何れか記載の方法。
(付記10)
画像からテキスト筆画画像を抽出する装置であって、
前記画像のエッジ情報と勾配情報を取得する情報取得手段と、
取得されたエッジ情報と勾配情報に予め設けられた強調処理を行うことにより、前記画像においてテキストに関するエッジ情報と勾配情報を強調する強調手段と、
強調されたエッジ情報と勾配情報に対応するテキスト筆画画像を取得する筆画画像取得手段と、
を備えることを特徴とする装置。
(付記11)
前記情報取得手段は、前記画像のエッジ情報と勾配情報を代表するステップ信号又はパルス信号を解析し、解析結果に基づいて前記エッジ情報と前記勾配情報を抽出する、
付記10記載の装置。
(付記12)
前記情報取得手段は、
画像の複数の方向におけるエッジ情報と勾配情報を取得するための複数のソーベル演算子のコンボリューションカーネルを利用して、前記画像の画像データと畳み込み演算をそれぞれ行う畳み込み演算サブ手段と、
各方向に対する畳み込み演算の結果を各方向に対する正パルス応答画像データと負パルス応答画像データに区分する区分サブ手段とを備え、
前記強調手段は、
各方向に対する正パルス応答画像データと負パルス応答画像データに、対向する方向へのオフセット及び加算を実行して、各方向に対する第1の合成画像データを取得する第1の合成画像取得サブ手段、及び/又は、
各方向に対する正パルス応答画像データと負パルス応答画像データに、反対の方向へのオフセット及び加算を実行して、各方向に対する第2の合成画像データを取得する第2の合成画像取得サブ手段を備え、
前記筆画画像取得手段は、
予め設けられた第1の閾値を用いて各方向に対する第1の合成画像データ及び/又は第2の合成画像データに第1の2値化処理をそれぞれ行う第1の2値化処理サブ手段と、第1の2値化処理が行われた、各方向に対する第1の合成画像データに整合処理を行って第1の細い筆画画像データを取得することにより、前記第1の細い筆画画像データに対応する第1の細い筆画画像を取得する第1の細い筆画画像取得サブ手段と、及び/又は、第1の2値化処理が行われた、各方向に対する第2の合成画像データに整合処理を行って、対応する第2の細い筆画画像データを取得することにより、前記第2の細い筆画画像データに対応する第2の細い筆画画像を取得する第2の細い筆画画像取得サブ手段と、及び/又は、
予め設けられた、第1の閾値よりも小さい第2の閾値を用いて各方向に対する第1の合成画像データ及び/又は第2の合成画像データに第2の2値化処理をそれぞれ行う第2の2値化処理サブ手段と、第2の2値化処理が行われた、各方向に対する第1の合成画像データに整合処理を行って第1の太い筆画画像データを取得することにより、前記第1の太い筆画画像データに対応する第1の太い筆画画像を取得する第1の太い筆画画像取得サブ手段と、及び/又は、第2の2値化処理が行われた、各方向に対する第2の合成画像データに整合処理を行って、対応する第2の太い筆画画像データを取得することにより、前記第2の太い筆画画像データに対応する第2の太い筆画画像を取得する第2の太い筆画画像取得サブ手段とを備える、
付記11記載の装置。
(付記13)
前記整合処理は、和集合を求める処理と、最大値を求める処理と、平均値を求める処理との何れかを含む、
付記12記載の装置。
(付記14)
前記畳み込み演算サブ手段は、画像の横方向、縦方向及び二つの対角線方向の四つの方向におけるエッジ情報と勾配情報を取得するための四つのソーベル演算子のコンボリューションカーネルを利用して前記画像の画像データと畳み込み演算をそれぞれ行う、付記12又は13記載の装置。
(付記15)
前記対向する方向へのオフセット及び加算は、以下の式
Ih(x,y)=(Ih-positive(x,y-w/2)+Ih-negative(x,y+w/2))/2、
Iv(x,y)=(Iv-positive(x-w/2,y)+Iv-negative(x+w/2,y))/2、
Ird(x,y)=(Ird-positive(x+w/2,y-w/2)+Ird-negative(x-w/2,y+w/2))/2、及び
Ild(x,y)=(Ild-positive(x-w/2,y-w/2)+Ild-negative(x+w/2,y+w/2))/2、
に基づいて行われ、
前記の反対する方向へのオフセット及び加算は、以下の式
Ih’(x,y)=(Ih-positive(x,y+w/2)+Ih-negative(x,y-w/2))/2、
Iv’(x,y)=(Iv-positive(x+w/2,y)+Iv-negative(x-w/2,y))/2、
Ird’(x,y)=(Ird-positive(x-w/2,y+w/2)+Ird-negative(x+w/2,y-w/2))/2、及び
Ild’(x,y)=(Ild-positive(x+w/2,y+w/2)+Ild-negative(x-w/2,y-w/2))/2、
に基づいて行われ、
xは画素の横座標、yは前記画素の縦座標、Ih(x,y)、Iv(x,y)、Ird(x,y)及びIld(x,y)は、前記画素の横方向、縦方向、及び二つの対角線方向の四つの方向に対する第1の合成画像データをそれぞれ示し、
Ih’(x,y)、Iv’(x,y)、Ird’(x,y)及びIld’(x,y)は、前記画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する第2の合成画像データをそれぞれ示し、
Ih-positive(x,y)、Iv-positive(x,y)、Ird-positive(x,y)及びIld-positive(x,y)は、前記画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する正パルス応答画像データをそれぞれ示し、
Ih-negative(x,y)、Iv-negative(x,y)、Ird-negative(x,y)及びIld-negative(x,y)は、前記画素の横方向、縦方向及び二つの対角線方向の四つの方法に対する負パルス応答画像データをそれぞれ示し、wは予め推定された筆画幅である、
付記12乃至14の何れか記載の装置。
(付記16)
前記筆画画像取得手段は、更に、予め設けられたフィルタリング条件を利用して前記第1の太い筆画画像データと前記第2の太い筆画画像データにおける連通領域データにフィルタリング処理をそれぞれ行うことにより、前記予め設けられたフィルタリング条件を満たす第1の連通領域の画像データと第2の連通領域の画像データを取得するフィルタリングサブ手段を備える、
付記12乃至15の何れか記載の装置。
(付記17)
前記予め設けられたフィルタリング条件は、少なくとも、前記連通領域内の画素の階調分散が予め設けられた分散の閾値よりも小さい条件と、前記連通領域内の内側エッジから外側エッジまでの画素極性が一致である条件と、前記連通領域の大きさが予め設けられた大きさの閾値内にある条件と、のうちの一つを含む、
付記16記載の装置。
(付記18)
テキスト筆画の精度とテキスト筆画のリコールレートとのうちの少なくとも一つに基づいて、前記第1の細い筆画画像と前記第2の細い筆画画像の何れかを最終的な細い筆画画像として選別し、及び/又は、前記第1の太い筆画画像と前記第2の太い筆画画像の何れかを最終的な太い筆画画像として選別する選別手段を更に備える、
付記12乃至17の何れか記載の装置。
(付記19)
コンピュータに、付記1乃至9の何れか記載の、画像からテキスト筆画画像を抽出する方法を実行させるための命令を含むコンピュータプログラム。
(付記20)
付記19記載のコンピュータプログラムを記録したコンピュータ読み取り可能な記録媒体。
402:情報取得手段
404:強調手段
406:筆画画像取得手段
400’:画像からテキスト筆画画像を抽出する装置
402’:情報取得手段
4022:畳込み演算サブ手段
4024:区分サブ手段
404’:強調手段
4042:第1の合成画像取得サブ手段
4044:第2の合成画像取得サブ手段
406’:筆画画像取得手段
4062:第1の2値化処理サブ手段
4064:第1の細い筆画画像取得サブ手段
4066:第2の細い筆画画像取得サブ手段
4068:第2の2値化処理サブ手段
40610:第1の太い筆画画像取得サブ手段
40612:第2の太い筆画画像取得サブ手段
Claims (10)
- 画像からテキスト筆画画像を抽出する方法をコンピュータに実行させるコンピュータプログラムであって、前記方法は、
前記画像のエッジ情報と勾配情報を取得するステップであって、画像データに含まれるステップ信号と所定の演算子に対応する信号を用いて第1のエッジ情報と第1の勾配情報を取得し、前記画像データに含まれるパルス信号と前記所定の演算子に対応する信号を用いて第2のエッジ情報と第2の勾配情報を取得する、ステップと、
取得されたエッジ情報と勾配情報に予め設けられた強調処理を行うことにより、前記画像においてテキストに関するエッジ情報と勾配情報を強調するステップと、
強調されたエッジ情報と勾配情報に対応するテキスト筆画画像を取得するステップと、
を含むことを特徴とするコンピュータプログラム。 - 前記画像のエッジ情報と勾配情報を取得するステップは、
前記画像のエッジ情報と勾配情報を代表する前記ステップ信号及び前記パルス信号を解析し、解析結果に基づいて前記第1及び第2のエッジ情報と前記第1及び第2の勾配情報を抽出することを含む、
請求項1記載のコンピュータプログラム。 - 前記画像のエッジ情報と勾配情報を取得するステップは、
画像の複数の方向におけるエッジ情報と勾配情報を取得するための複数のソーベル演算子のコンボリューションカーネルを利用して、前記画像の画像データと畳み込み演算をそれぞれ行い、
各方向に対する畳み込み演算の結果を各方向に対する正パルス応答画像データと負パルス応答画像データに区分することを含み、
前記画像においてテキストに関するエッジ情報と勾配情報を強調するステップは、
各方向に対する正パルス応答画像データと負パルス応答画像データに、対向する方向へのオフセット及び加算を実行して、各方向に対する第1の合成画像データを取得し、及び/又は、
各方向に対する正パルス応答画像データと負パルス応答画像データに、反対の方向へのオフセット及び加算を実行して、各方向に対する第2の合成画像データを取得することを含み、
前記強調されたエッジ情報と勾配情報に対応するテキスト筆画画像を取得するステップは、
予め設けられた第1の閾値を用いて各方向に対する第1の合成画像データ及び/又は第2の合成画像データに第1の2値化処理をそれぞれ行い、第1の2値化処理が行われた、各方向に対する第1の合成画像データに整合処理を行って第1の細い筆画画像データを取得することにより、前記第1の細い筆画画像データに対応する第1の細い筆画画像を取得し、及び/又は、第1の2値化処理が行われた、各方向に対する第2の合成画像データに整合処理を行って、対応する第2の細い筆画画像データを取得することにより、前記第2の細い筆画画像データに対応する第2の細い筆画画像を取得し、及び/又は、
予め設けられた、第1の閾値よりも小さい第2の閾値を用いて各方向に対する第1の合成画像データ及び/又は第2の合成画像データに第2の2値化処理をそれぞれ行い、第2の2値化処理が行われた、各方向に対する第1の合成画像データに整合処理を行って第1の太い筆画画像データを取得することにより、前記第1の太い筆画画像データに対応する第1の太い筆画画像を取得し、及び/又は、第2の2値化処理が行われた、各方向に対する第2の合成画像データに整合処理を行って、対応する第2の太い筆画画像データを取得することにより、前記第2の太い筆画画像データに対応する第2の太い筆画画像を取得することを含む、
請求項2記載のコンピュータプログラム。 - 前記整合処理は、和集合を求める処理と、最大値を求める処理と、平均値を求める処理との何れかを含む、
請求項3記載のコンピュータプログラム。 - 前記画像の複数の方向におけるエッジ情報と勾配情報を取得するための複数のソーベル演算子のコンボリューションカーネルを利用して前記画像の画像データと畳み込み演算をそれぞれ行うステップは、
画像の横方向、縦方向及び二つの対角線方向の四つの方向におけるエッジ情報と勾配情報を取得するための四つのソーベル演算子のコンボリューションカーネルを利用して前記画像の画像データと畳み込み演算をそれぞれ行うことを含む、
請求項3又は4記載のコンピュータプログラム。 - 前記対向する方向へのオフセット及び加算は、以下の式
Ih(x, y) = (Ih-positive(x, y-w/2) + Ih-negative(x, y+w/2))/2、
Iv(x, y) = (Iv-positive(x-w/2, y) + Iv-negative(x+w/2, y))/2、
Ird(x, y) = (Ird-positive(x+w/2, y-w/2) + Ird-negative(x-w/2, y+w/2))/2、及び
Ild(x, y) = (Ild-positive(x-w/2, y-w/2) + Ild-negative(x+w/2, y+w/2))/2、
に基づいて行われ、
前記の反対の方向へのオフセット及び加算は、以下の式
Ih’(x, y) = (Ih-positive(x, y+w/2) + Ih-negative(x, y-w/2))/2、
Iv’(x, y) = (Iv-positive(x+w/2, y) + Iv-negative(x-w/2, y))/2、
Ird’(x, y) = (Ird-positive(x-w/2, y+w/2) + Ird-negative(x+w/2, y-w/2))/2、及び
Ild’(x, y) = (Ild-positive(x+w/2, y+w/2) + Ild-negative(x-w/2, y-w/2))/2、
に基づいて行われ、
xは画素の横座標、yは前記画素の縦座標、Ih(x, y)、Iv(x, y)、Ird(x, y)とIld(x, y)は前記画素の横方向、縦方向、及び二つの対角線方向の四つの方向に対する第1の合成画像データをそれぞれ示し、
Ih’(x, y)、Iv’(x, y)、Ird’(x, y)及びIld’(x, y)は、前記画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する第2の合成画像データをそれぞれ示し、
Ih-positive(x, y)、Iv-positive(x, y)、Ird-positive(x, y)及びIld-positive(x, y)は、前記画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する正パルス応答画像データをそれぞれ示し、
Ih-negative(x, y)、Iv-negative(x, y)、Ird-negative(x, y)及びIld-negative(x, y)は、前記画素の横方向、縦方向及び二つの対角線方向の四つの方法に対する負パルス応答画像データをそれぞれ示し、wは予め推定された筆画幅である、
請求項3乃至5の何れか記載のコンピュータプログラム。 - 前記第1の太い筆画画像データと前記第2の太い筆画画像データにそれぞれ対応する第1の太い筆画画像と第2の太い筆画画像を取得するステップは、
予め設けられたフィルタリング条件を利用して前記第1の太い筆画画像データと前記第2の太い筆画画像データにおける連通領域データにフィルタリング処理をそれぞれ行うことにより、前記予め設けられたフィルタリング条件を満たす第1の連通領域の画像データと第2の連通領域の画像データを取得し、
前記第1の連通領域の画像データと前記第2の連通領域の画像データにそれぞれ対応する第1の太い筆画画像と第2の太い筆画画像を取得することを含む、
請求項3乃至6の何れか記載のコンピュータプログラム。 - 前記予め設けられたフィルタリング条件は、少なくとも、
前記連通領域内の画素の階調分散が予め設けられた分散の閾値よりも小さい条件と、
前記連通領域内の内側エッジから外側エッジまでの画素極性が一致する条件と、
前記連通領域の大きさが予め設けられた大きさの閾値内にある条件と、
のうちの一つを含む、
請求項7記載のコンピュータプログラム。 - テキスト筆画の精度とテキスト筆画のリコールレートとのうちの少なくとも一つに基づいて、前記第1の細い筆画画像と前記第2の細い筆画画像の何れかを最終的な細い筆画画像として選別し、及び/又は、前記第1の太い筆画画像と前記第2の太い筆画画像の何れかを最終的な太い筆画画像として選別することを更に含む、
請求項3乃至8の何れか記載のコンピュータプログラム。 - 画像からテキスト筆画画像を抽出する装置であって、
前記画像のエッジ情報と勾配情報を取得する情報取得手段であって、画像データに含まれるステップ信号と所定の演算子に対応する信号を用いて第1のエッジ情報と第1の勾配情報を取得し、前記画像データに含まれるパルス信号と前記所定の演算子に対応する信号を用いて第2のエッジ情報と第2の勾配情報を取得する、情報取得手段と、
取得されたエッジ情報と勾配情報に予め設けられた強調処理を行うことにより、前記画像においてテキストに関するエッジ情報と勾配情報を強調する強調手段と、
強調されたエッジ情報と勾配情報に対応するテキスト筆画画像を取得する筆画画像取得手段と、
を備えることを特徴とする装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110157673.4 | 2011-05-31 | ||
CN201110157673.4A CN102810155B (zh) | 2011-05-31 | 2011-05-31 | 用于从图像中提取文本笔划图像的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012252691A JP2012252691A (ja) | 2012-12-20 |
JP5939023B2 true JP5939023B2 (ja) | 2016-06-22 |
Family
ID=47233859
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012110573A Active JP5939023B2 (ja) | 2011-05-31 | 2012-05-14 | コンピュータプログラム及び画像抽出装置 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5939023B2 (ja) |
CN (1) | CN102810155B (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104112135B (zh) * | 2013-04-18 | 2017-06-06 | 富士通株式会社 | 文本图像提取装置以及方法 |
CN103761520B (zh) * | 2013-12-05 | 2016-09-21 | 南京理工大学 | 基于笔划宽度的文档图像无参二值化方法 |
CN104036253A (zh) * | 2014-06-20 | 2014-09-10 | 智慧城市系统服务(中国)有限公司 | 一种车道线追踪方法及系统 |
CN107967459B (zh) * | 2017-12-07 | 2021-08-24 | 北京小米移动软件有限公司 | 卷积处理方法、装置及存储介质 |
CN111557692B (zh) * | 2020-04-26 | 2022-11-22 | 深圳华声医疗技术股份有限公司 | 目标器官组织的自动测量方法、超声测量装置及介质 |
CN116916047B (zh) * | 2023-09-12 | 2023-11-10 | 北京点聚信息技术有限公司 | 一种版式文件识别数据智能存储方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0650534B2 (ja) * | 1988-11-30 | 1994-06-29 | 株式会社東芝 | マーク検出方式 |
JP4587698B2 (ja) * | 2004-04-21 | 2010-11-24 | オムロン株式会社 | 文字成分抽出装置 |
JP4420877B2 (ja) * | 2005-09-22 | 2010-02-24 | シャープ株式会社 | 画像処理方法、画像処理装置、及び画像出力装置 |
JP4701144B2 (ja) * | 2006-09-26 | 2011-06-15 | 富士通株式会社 | 画像処理装置、画像処理方法および画像処理プログラム |
CN101615252B (zh) * | 2008-06-25 | 2012-07-04 | 中国科学院自动化研究所 | 一种自适应图像文本信息提取方法 |
JP5010627B2 (ja) * | 2009-02-19 | 2012-08-29 | 三菱重工業株式会社 | 文字認識装置及び文字認識方法 |
JP5286215B2 (ja) * | 2009-09-30 | 2013-09-11 | エヌ・ティ・ティ・コムウェア株式会社 | 輪郭抽出装置、輪郭抽出方法、および輪郭抽出プログラム |
-
2011
- 2011-05-31 CN CN201110157673.4A patent/CN102810155B/zh active Active
-
2012
- 2012-05-14 JP JP2012110573A patent/JP5939023B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
CN102810155A (zh) | 2012-12-05 |
JP2012252691A (ja) | 2012-12-20 |
CN102810155B (zh) | 2015-04-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7415251B2 (ja) | 画像処理用の装置及び方法、並びにニューラルネットワークトをトレーニングするシステム | |
JP5939023B2 (ja) | コンピュータプログラム及び画像抽出装置 | |
CN101601287B (zh) | 产生照片级真实感图像缩略图的设备和方法 | |
KR101932009B1 (ko) | 다중 객체 검출을 위한 영상 처리 장치 및 방법 | |
Li et al. | Finding the secret of image saliency in the frequency domain | |
JP6240199B2 (ja) | 画像における対象物の識別方法及び装置 | |
US20030072487A1 (en) | Background-based image segmentation | |
JP2012243313A (ja) | 画像処理方法および画像処理装置 | |
Lu et al. | Deep texture and structure aware filtering network for image smoothing | |
TWI254891B (en) | Face image detection method, face image detection system, and face image detection program | |
CN112651979A (zh) | 肺部x光图像分割方法、系统、计算机设备及存储介质 | |
US20230417700A1 (en) | Automated analysis of analytical gels and blots | |
KR101932008B1 (ko) | 영상의 특징 및 맥락에 기초한 영상 분석 장치 및 방법 | |
CN111222530A (zh) | 一种细粒度图像分类方法、系统、装置和存储介质 | |
CN112883926A (zh) | 表格类医疗影像的识别方法及装置 | |
CN107346417B (zh) | 人脸检测方法及装置 | |
WO2019181072A1 (ja) | 画像処理方法、コンピュータプログラムおよび記録媒体 | |
CN116228757B (zh) | 一种基于图像处理算法的深海网箱网衣检测方法 | |
CN114519689A (zh) | 图像篡改检测方法、装置、设备及计算机可读存储介质 | |
CN110991408A (zh) | 基于深度学习方法分割脑白质高信号的方法和装置 | |
US9225876B2 (en) | Method and apparatus for using an enlargement operation to reduce visually detected defects in an image | |
CN113706636A (zh) | 一种用于篡改图像识别的方法与装置 | |
CN112465817A (zh) | 一种基于方向滤波器的路面裂缝检测方法 | |
Othman et al. | The fusion of edge detection and mathematical morphology algorithm for shape boundary recognition | |
JP6539469B2 (ja) | 特徴量抽出装置、特徴量抽出方法及び特徴量抽出用プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150319 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160127 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160202 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160330 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160419 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160502 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5939023 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |