JP2006277150A - 画像分離装置、画像分離方法およびプログラム - Google Patents
画像分離装置、画像分離方法およびプログラム Download PDFInfo
- Publication number
- JP2006277150A JP2006277150A JP2005093261A JP2005093261A JP2006277150A JP 2006277150 A JP2006277150 A JP 2006277150A JP 2005093261 A JP2005093261 A JP 2005093261A JP 2005093261 A JP2005093261 A JP 2005093261A JP 2006277150 A JP2006277150 A JP 2006277150A
- Authority
- JP
- Japan
- Prior art keywords
- image data
- pixel
- pixels
- image
- region
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Character Input (AREA)
- Facsimile Image Signal Circuits (AREA)
- Image Analysis (AREA)
Abstract
【課題】 活字文字と手書文字が混在した画像から各々の文字を示す画像を分離生成する手段を提供する。
【解決手段】 エッジ画像データ生成部1112は、活字文字および手書文字の混在する画像を示す画像データを取得し、当該画像のエッジ領域を抽出する。動的閾値2値画像データ生成部1113は動的閾値2値化処理により、当該画像の明度が非連続的に変化する領域を抽出する。手書文字除去画像データ生成部1114は、エッジ画像データ生成部1112および動的閾値2値画像データ生成部1113により抽出された領域の重複部分を活字文字を示す画像領域として抽出する。一方、手書文字画像データ生成部1115は、エッジ画像データ生成部1112および手書文字除去画像データ生成部1114により抽出された領域の差分を手書文字を示す画像領域をして抽出する。
【選択図】 図1
【解決手段】 エッジ画像データ生成部1112は、活字文字および手書文字の混在する画像を示す画像データを取得し、当該画像のエッジ領域を抽出する。動的閾値2値画像データ生成部1113は動的閾値2値化処理により、当該画像の明度が非連続的に変化する領域を抽出する。手書文字除去画像データ生成部1114は、エッジ画像データ生成部1112および動的閾値2値画像データ生成部1113により抽出された領域の重複部分を活字文字を示す画像領域として抽出する。一方、手書文字画像データ生成部1115は、エッジ画像データ生成部1112および手書文字除去画像データ生成部1114により抽出された領域の差分を手書文字を示す画像領域をして抽出する。
【選択図】 図1
Description
本発明は、文字認識処理のための画像分離技術に関する。
活字印刷された文書に対し、手書で注記等の追記がなされる場合がある。そのような場合、紙面には活字文字と手書文字が混在する。そのような紙面をスキャンして得られる画像データに対し文字認識処理を行った場合、活字文字と手書文字との形状パターンや濃淡のパターンが異なる結果、認識精度が低下してしまう。もし、活字文字と手書文字の混在する画像から活字文字と手書文字とを分離することができれば、分離した活字文字と手書文字との各々に対し個別に文字認識処理を行うことが可能となるため、そのような文字認識処理における認識精度の低下は生じない。
活字文字と手書文字との混在する画像から活字文字と手書文字とを分離する技術を開示したものとして、例えば特許文献1乃至4がある。
特開平5−189604号公報
特開平7−37034号公報
特開平7−93466号公報
特開平9−212579号公報
特許文献1には、文字を示す画像の高さのばらつきに基づき、その画像が活字文字および手書文字のいずれを示す画像であるかを判定する技術が開示されている。特許文献2には、文字を示す画像を、活字文字を表すものと仮定して行った文字認識処理の結果と、手書文字を表すものと仮定して行った文字認識処理の結果とを比較することにより、その画像が活字文字および手書文字のいずれを示す画像であるかを判定する技術が開示されている。特許文献3には、2×2パターンマッチングにより文字を示す画像の直線成分および非直線成分を抽出し、抽出したそれらの成分の比率に基づき、その画像が活字文字および手書文字のいずれを示す画像であるかを判定する技術が開示されている。特許文献4には、文字を示す画像の高さの閾値との比較結果と、その文字の画像に含まれる直線性に基づき、その画像が活字文字および手書文字のいずれを示す画像であるかを判定する技術が開示されている。
上記の特許文献1に開示の技術による場合、高さのばらつきが大きいフォントセットを用いた活字文字が手書文字と誤認されたり、高さのばらつきが小さい手書文字が活字文字と誤認されたりすることがある。また、特許文献2に開示の技術による場合、文字認識処理を各々の画像につき2回行う必要があるため、通常よりも長い処理時間を要する。また、特許文献3および4に開示の技術による場合、例えば行書体等のように、フォントセットに含まれる画像の直線成分が小さいものについては、活字文字でありながら手書文字と誤認されることがある。
上述の事情に鑑み、本発明は様々な種類の活字フォントによる活字文字と、様々な筆跡を備えた手書文字がどのように混在した画像からであっても、活字文字を示す画像と手書文字を示す画像とを容易に分離する手段を提供することを目的とする。
上述の課題を解決するため、本発明は、平面上に規則的に配置された画素の各々の明度を示す画素明度データの集まりにより単色の画像を示す明度画像データを取得する明度画像データ取得手段と、前記明度画像データ取得手段により取得された明度画像データにより示される画像において明度の変化率が閾値以上である領域の画素をオン画素とし他の画素をオフ画素とすることにより、エッジ領域を2値で表現するエッジ画像データを生成するエッジ画像データ生成手段と、前記エッジ画像データ生成手段による場合とは異なる方法により、前記明度画像データ取得手段により取得された明度画像データにより示される画像において明度が非連続的に変化している領域を2値で表現する2値画像データを生成する2値画像データ生成手段と、前記エッジ画像データ生成手段により生成されたエッジ画像データおよび前記2値画像データ生成手段により生成された2値画像データの各々により示される画像の同じ位置の画素がともにオン画素である場合には当該画素をオン画素としそれ以外の場合には当該画素をオフ画素とすることにより、手書文字除去画像データを生成する手書文字除去画像データ生成手段とを備えることを特徴とする画像分離装置を提供する。
かかる構成の画像分離装置によれば、活字文字と手書文字を示す画像データから、手書文字の部分を含まない画像データが生成される。
また、本発明は、平面上に規則的に配置された画素の各々の明度を示す画素明度データの集まりにより単色の画像を示す明度画像データを取得する明度画像データ取得手段と、前記明度画像データ取得手段により取得された明度画像データにより示される画像において明度の変化率が閾値以上である領域の画素をオン画素とし他の画素をオフ画素とすることにより、エッジ領域を2値で表現する全領域エッジ画像データを生成する全領域エッジ画像データ生成手段と、前記明度画像データ取得手段により取得された明度画像データにより示される画像において所定の閾値以上の明度を示すオン画素と当該所定の閾値未満の明度を示すオフ画素とが所定の条件を満たす空間的なばらつきを伴い配置されている網点領域を抽出し、抽出した網点領域に配置される画素をオン画素としそれ以外の領域に配置される画素をオフ画素とすることにより、網点領域を2値で表現する網点領域画像データを生成する網点領域画像データ生成手段と、前記明度画像データ取得手段により取得された明度画像データにより示される画像において明度もしくは明度の変化率が所定の範囲内である画素が連続している高濃度領域を抽出し、抽出した高濃度領域に配置される画素をオン画素としそれ以外の領域に配置される画素をオフ画素とすることにより、高濃度領域を2値で表現する高濃度領域画像データを生成する高濃度領域画像データ生成手段と、前記全領域エッジ画像データ生成手段により生成された全領域エッジ画像データと前記網点領域画像データ生成手段により生成された網点領域画像データと前記高濃度領域画像データ生成手段により生成された高濃度領域画像データの各々により示される画像の同じ位置の画素が全てオフ画素である場合には当該画素をオフ画素としそれ以外の場合にはオン画素とすることにより、全領域画像データを生成する全領域画像データ生成手段と、前記全領域画像データ生成手段により生成された全領域画像データにより示される画像に含まれるオン画素のうち互いに連続して配置されるオン画素の集まりの外縁部に配置されるオン画素をオフ画素に変更する収縮処理を行った後に当該オン画素の集まりの外縁部に隣接するオフ画素をオン画素に変更する膨張処理を行うことにより、絵柄領域画像データを生成する絵柄領域画像データ生成手段と、前記絵柄領域画像データ生成手段により生成された絵柄領域画像データにより示される画像のオン画素とオフ画素を互いに入れ替えることにより、絵柄外領域画像データを生成する絵柄外領域画像データ生成手段と、前記全領域画像データ生成手段により生成された全領域画像データと前記絵柄外領域画像データ生成手段により生成された絵柄外領域画像データの各々により示される画像の同じ位置の画素がともにオン画素である場合には当該画素をオン画素としそれ以外の場合には当該画素をオフ画素とすることにより、エッジ画像データを生成するエッジ画像データ生成手段と、前記エッジ画像データ生成手段による場合とは異なる方法により、前記明度画像データ取得手段により取得された明度画像データにより示される画像において明度が非連続的に変化している領域を2値で表現する2値画像データを生成する2値画像データ生成手段と、前記エッジ画像データ生成手段により生成されたエッジ画像データおよび前記2値画像データ生成手段により生成された2値画像データの各々により示される画像の同じ位置の画素がともにオン画素である場合には当該画素をオン画素としそれ以外の場合には当該画素をオフ画素とすることにより、手書文字除去画像データを生成する手書文字除去画像データ生成手段とを備えることを特徴とする画像分離装置を提供する。
かかる構成の画像分離装置によれば、活字文字および手書文字を示す画像データから、活字文字を示す画像データが生成される。
好ましい態様において、前記2値画像データ生成手段は、前記明度画像データ取得手段により取得された明度画像データにより示される画像の注目画素の明度が当該注目画素を含む所定領域の明度に応じた閾値以上である場合には当該注目画素をオン画素としそれ以外の場合にはオフ画素とすることにより、明度が非連続的に変化している領域を2値で表現する動的閾値2値化処理手段であるようにしてもよい。
他の好ましい態様において、前記画像分離装置は、前記2値画像データ生成手段により生成された2値画像データにより示される画像の注目画素および当該注目画素の周辺の所定領域に配置される画素の全てがオフ画素である場合もしくは注目画素および当該注目画素の周辺の所定領域に配置される画素の全てがオン画素である場合には当該注目画素をオフ画素としそれ以外の場合には当該注目画素をオン画素とすることにより、輪郭画像データを生成する輪郭画像データ生成手段を備え、前記手書文字除去画像データ生成手段は、前記2値画像データ生成手段により生成された2値画像データの代わりに、前記輪郭画像データ生成手段により生成された輪郭画像データを用いて前記手書文字除去画像データを生成するようにしてもよい。
かかる構成の画像分離装置によれば、活字文字を示す画像データが高い精度で生成される。
他の好ましい態様において、前記画像分離装置は、前記エッジ画像データ生成手段により生成されたエッジ画像データおよび前記手書文字除去画像データ生成手段により生成された手書文字除去画像データに関し、当該エッジ画像データにより示される画像の注目画素がオン画素でありかつ当該手書文字除去画像データにより示される画像の当該注目画素と同じ位置の画素がオフ画素である場合には当該注目画素をオン画素としそれ以外の場合には当該画素をオフ画素とすることにより、手書文字画像データを生成する手書文字画像データ生成手段を備えるようにしてもよい。
かかる構成の画像分離装置によれば、活字文字と手書文字を示す画像データから、手書文字を示す画像データが生成される。
また、好ましい態様において、前記画像分離装置の前記手書文字除去画像データ生成手段による手書文字除去画像データの生成において用いられるエッジ画像データと前記手書文字画像データ生成手段による手書文字画像データの生成において用いられるエッジ画像データは、互いに異なるパラメータを用いて生成された異なるデータであってもよい。
かかる構成の画像分離装置によれば、活字文字を示す画像データおよび手書文字を示す画像データが各々高い精度で生成される。
前記画像分離装置は、前記手書文字除去画像データ生成手段により生成された手書文字除去画像データにより示される画像に含まれるオン画素のうち互いに隣接もしくは近接するオン画素の集まりをセグメントとして認識するセグメント認識手段と、前記セグメント認識手段により認識されたセグメントの形状に関する特性を抽出する形状特性抽出手段と、前記形状特性抽出手段により抽出された特性に基づき、前記セグメント認識手段により認識されたセグメントの集まりから活字文字を示すセグメントを抽出し、抽出したセグメントの集まりを示す活字文字画像データを生成する活字文字画像データ生成手段とを備えるように構成されてもよい。
上記画像分離装置における前記形状特性抽出手段は、例えば、セグメントの縦横比、幅の均一性および直線性の少なくとも1つを当該セグメントの形状に関する特性として抽出する。
かかる構成の画像分離装置によれば、活字文字を示す画像データに混在する線分を示す画像データを除去することができる。
また、本発明は、上記いずれかに記載の前記画像切出装置において行われる画像切出方法を提供する。さらに本発明は、上記いずれかに記載の前記画像切出装置が行う処理と同様の処理をコンピュータに実行させることを特徴とするプログラムを提供する。
本発明によれば、活字文字と手書文字が混在する画像を示す画像データから、各々の文字を示す画像データを分離することが可能となる。その際、活字文字および手書文字の高さや直線成分等の特性が活字文字に用いられている活字フォントや手書文字の筆跡に応じて様々に変化するような場合であっても、正しい結果が短時間で得られる。
[1.第1実施形態]
図1は本発明の第1実施形態にかかる文字認識システム1の構成を示したブロック図である。文字認識システム1は、活字文字および手書文字の混在した紙面から光学的に読み取られた画像データから当該画像データにより示される文字を認識し、認識した文字を示すテキストデータを生成するシステムである。文字認識システム1は、紙面に書かれた図形や文字を光学的に読み取ってそれらの図形や文字を示す明度画像データを生成するスキャナ10と、スキャナ10により生成された明度画像データから活字文字を示す画像データおよび手書文字を示す画像データを各々分離生成する画像分離装置11と、画像分離装置11により分離複生成された画像データに対し文字認識処理を行い画像データにより示される文字の内容を示すテキストデータを生成する文字認識処理装置12を備えている。
図1は本発明の第1実施形態にかかる文字認識システム1の構成を示したブロック図である。文字認識システム1は、活字文字および手書文字の混在した紙面から光学的に読み取られた画像データから当該画像データにより示される文字を認識し、認識した文字を示すテキストデータを生成するシステムである。文字認識システム1は、紙面に書かれた図形や文字を光学的に読み取ってそれらの図形や文字を示す明度画像データを生成するスキャナ10と、スキャナ10により生成された明度画像データから活字文字を示す画像データおよび手書文字を示す画像データを各々分離生成する画像分離装置11と、画像分離装置11により分離複生成された画像データに対し文字認識処理を行い画像データにより示される文字の内容を示すテキストデータを生成する文字認識処理装置12を備えている。
画像分離装置11は、画像分離装置11の構成部を制御する制御部111と、画像分離装置11がスキャナ10から明度画像データを受信し、また文字認識処理装置12に活字文字もしくは手書文字を示す画像データを送信するための入出力インタフェース112と、制御部111による各種処理を指示するプログラムおよび制御部111により生成される各種データを記憶するとともに制御部111のワークエリアとして用いられる記憶部113を備えている。
画像分離装置11の制御部111は、スキャナ10から明度画像データを受信する明度画像データ取得部1111を備えている。明度画像データ取得部1111は入出力インタフェース112を介してスキャナ10から活字文字および手書文字の混在した画像を示す明度画像データを受信する。
明度画像データ取得部1111により受信される明度画像データは、平面上に等間隔で配置された画素の各々に関し、その画素の位置における明度を示す画素データの集まりであり、全体として単色の明暗により画像を表現する画像データである。本実施形態において、スキャナ10により読み取り処理の行われる紙面には活字文字と手書文字が混在して記載されており、従って明度画像データはそれらの文字の画像を示している。
制御部111は、明度画像データに対しエッジ抽出処理を行うエッジ画像データ生成部1112を備えている。エッジ画像データ生成部1112は、明度画像データ取得部1111により受信された明度画像データに含まれる画素データを、互いに隣接もしくは近接するものどうしで比較し、その変化率が所定の閾値以上であるエッジ領域を抽出する。エッジ画像データ生成部1112は抽出したエッジ領域に含まれる画素については黒を示すオン画素データ、エッジ領域以外の領域に含まれる画素については白を示すオフ画素データを各々生成することにより、全体としてエッジ領域を黒とする2値画像データを生成する。以下、エッジ画像データ生成部1112により生成される2値画像データを「エッジ画像データ」と呼ぶ。
エッジ画像データにより示される画像には、明度画像データにより示される画像に含まれる活字文字と背景の境界線および手書文字と背景の境界線が示されることになる。
制御部111は、明度画像データに対し動的閾値2値化処理を行う動的閾値2値画像データ生成部1113を備えている。動的閾値2値画像データ生成部1113は、明度画像データ取得部1111により受信された明度画像データに示される画像を構成する任意の画素を注目画素として選択し、明度画像データに含まれる注目画素に対応する画素データ(以下、「注目画素データ」と呼ぶ)により示される明度と、注目画素の周辺の所定領域、例えば注目画素を中心とする縦5画素×横5画素の領域に含まれる画素に対応する画素データにより示される明度の平均値とを差を算出する。動的閾値2値画像データ生成部1113はその差が所定の閾値以上であれば黒を示すオン画素データ、その差が所定の閾値未満であれば白を示すオフ画素データをその注目画素に対応する画素データとして生成する。
動的閾値2値画像データ生成部1113は明度画像データに含まれる全ての画素データに関し、その画素データを注目画素データとして上記の処理を繰り返し、全体として明度画像データにより示される画像における明度が非連続的に変化している領域を黒とする2値画像データを生成する。以下、動的閾値2値画像データ生成部1113により生成される2値画像データを「動的閾値2値画像データ」と呼ぶ。
動的閾値2値画像データにより示される画像には、明度画像データにより示される画像に含まれる活字文字の明度が背景の明度から大きく変化する位置を示す線および手書文字の明度が背景の明度から大きく変化する位置を示す線が示されることになる。
ところで、一般的に活字文字を示す画像と手書文字を示す画像は、文字を構成する線における明度の分布が異なっている。すなわち、活字文字を構成する線の領域の明度がほぼ均一であるのに対し、手書文字を構成する線の領域の明度はその領域の中心線に向かい徐々に明度を増すのが一般的である。図2は、そのような活字文字と手書文字を示す画像の明度分布の差異を示した図である。図2において文字列Aは活字文字を示し、文字列Bは手書文字を示している。図2(a)および(b)は、文字列Aおよび文字列Bの各々を構成する線を拡大し、その明度が変化する様子を模式的に示した図である。図2(c)は、文字列Aおよび文字列Bの各々を構成する線の中心線に直交する線(図2(c)の点線)上の各々の画素における明度を示したグラフである。
図2に示されるように、活字文字領域と背景領域との境界領域において、それらの明度は急峻に変化する。一方、手書文字領域と背景領域との境界領域において、それらの明度は比較的滑らかに変化する。従って、エッジ画像データ生成部1112によるエッジ抽出処理において用いられる閾値等のパラメータと、動的閾値2値画像データ生成部1113による動的閾値2値化処理において用いられる動的閾値算出のための周辺画素数等のパラメータとを適する値にチューニングすることにより、以下のような結果を同時に得ることができる。
(ア)明度画像データのうち活字文字を示す部分については、エッジ画像データと動的閾値2値画像データが、ともに背景領域と文字領域との境界線の位置(図2(c)における位置α)を黒で示す画像データとなる。
(イ)明度画像データのうち手書文字を示す部分については、エッジ画像データは、例えば境界領域の外側の位置(図2(c)における位置β1)を黒で示す画像データとなるのに対し、動的閾値2値画像データは、例えば境界領域の内側の位置(図2(c)における位置βc)を黒で示す画像データとなる。
(イ)明度画像データのうち手書文字を示す部分については、エッジ画像データは、例えば境界領域の外側の位置(図2(c)における位置β1)を黒で示す画像データとなるのに対し、動的閾値2値画像データは、例えば境界領域の内側の位置(図2(c)における位置βc)を黒で示す画像データとなる。
以下の説明において、エッジ画像データ生成部1112によるエッジ抽出処理において用いられるパラメータおよび動的閾値2値画像データ生成部1113による動的閾値2値化処理において用いられるパラメータは、上記のようにチューニングされているものとする。
制御部111は、エッジ画像データと動的閾値2値画像データの各々に含まれる画素データの論理積を算出する手書文字除去画像データ生成部1114を備えている。手書文字除去画像データ生成部1114は、エッジ画像データ生成部1112により生成されたエッジ画像データに含まれる画素データと、動的閾値2値画像データ生成部1113により生成された動的閾値2値画像データに含まれる画素データの各々から、同じ位置の画素を示す画素データを選択し、選択した画素データがともにオン画素データであればその画素に対応する画素データとしてオン画素データを生成し、選択した画素データの少なくとも一方がオフ画素データであればその画素に対応する画素データとしてオフ画素データを生成する。
手書文字除去画像データ生成部1114はエッジ画像データおよび動的閾値2値画像データに含まれる全ての画素データのペアに関し上記の処理を繰り返し、全体としてエッジ画像データにより示される画像における黒の領域と、動的閾値2値画像データにより示される画像における黒の領域とが重なる領域を黒とする2値画像データを生成する。
上記のように、エッジ画像データと動的閾値2値画像データは、活字文字領域に関してはともに同じ背景領域との境界線を示し、手書文字領域に関しては異なる背景領域との境界線を示す。従って、手書文字除去画像データ生成部1114により生成される2値画像データには、手書文字領域に関する背景領域との境界線は含まれず、活字文字領域に関する背景領域との境界線のみを示すものとなる。従って、以下、手書文字除去画像データ生成部1114により生成される2値画像データを「手書文字除去画像データ」と呼ぶ。この場合、手書文字除去画像データは、すなわち活字文字の形状を示す画像データである。
制御部111は、エッジ画像データと手書文字除去画像データの各々に含まれる画素データの差分を算出する手書文字画像データ生成部1115を備えている。手書文字画像データ生成部1115は、エッジ画像データ生成部1112により生成されたエッジ画像データに含まれる画素データと、手書文字除去画像データ生成部1114により生成された手書文字除去画像データに含まれる画素データの各々から、同じ位置の画素を示す画素データを選択し、選択したエッジ画像データの画素データがオン画素データであり、かつ選択した手書文字除去画像データの画素データがオフ画素データであれば、その画素に対応する画素データとしてオン画素データを生成し、それ以外の場合にはオフ画素データを生成する。
手書文字画像データ生成部1115はエッジ画像データおよび手書文字除去画像データに含まれる全ての画素データのペアに関し上記の処理を繰り返し、全体としてエッジ画像データにより示される画像における黒の領域から、手書文字除去画像データにより示される画像における黒の領域を差し引いた残りの領域を黒とする2値画像データを生成する。
既に述べたように、エッジ画像データにより示される画像には活字文字と手書文字の両方に関する文字領域と背景領域との境界線が含まれ、手書文字除去画像データにより示される画像には活字文字に関する文字領域と背景領域との境界線のみが含まれている。従って、それらの差分を示すデータにより示される画像には、手書文字に関する文字領域と背景領域との境界線のみが含まれることになる。すなわち、手書文字画像データ生成部1115により生成される2値画像データは手書文字の形状を示す画像データである。従って、以下、手書文字画像データ生成部1115により生成される2値画像データを「手書文字画像データ」と呼ぶ。
制御部111は、手書文字除去画像データ生成部1114により生成された手書文字除去画像データおよび手書文字画像データ生成部1115により生成された手書文字画像データをそれぞれ出力する手書文字除去画像データ出力部1116および手書文字画像データ出力部1117を備えている。手書文字除去画像データ出力部1116および手書文字画像データ出力部1117は、それぞれ手書文字除去画像データおよび手書文字画像データを、入出力インタフェース112を介して文字認識処理装置12に送信する。
文字認識処理装置12は、画像分離装置11から手書文字除去画像データを受け取ると、活字文字用の辞書データを用いる等、活字文字に適する方法により文字認識処理を行い、手書文字除去画像データにより示される画像に含まれる文字の内容を示すテキストデータを生成する。そのように生成されるテキストデータは、スキャナ10により読み取られた紙面に記載されていた活字文字の内容を示すテキストデータである。
また、文字認識処理装置12は、画像分離装置11から手書文字画像データを受け取ると、手書文字用の辞書データを用いる等、手書文字に適する方法により文字認識処理を行い、手書文字画像データにより示される画像に含まれる文字の内容を示すテキストデータを生成する。そのように生成されるテキストデータは、スキャナ10により読み取られた紙面に記載されていた手書文字の内容を示すテキストデータである。
以上説明したように、文字認識システム1によれば、活字文字と手書文字が混在して記載されている紙面から、活字文字を示す画像と手書文字を示す画像が分離生成される結果、各々の画像に対し行われる文字認識処理において、高い精度の認識結果が得られる。
[2.第2実施形態]
図3は本発明の第2実施形態にかかる文字認識システム2の構成を示したブロック図である。文字認識システム2は、活字文字および手書文字に加え、写真や円グラフ等の絵柄およびグラフの縦軸・横軸や棒グラフ等の線分の混在した紙面から光学的に読み取られた画像データから当該画像データにより示される文字を認識し、認識した文字を示すテキストデータを生成するシステムである。文字認識システム2の構成および動作は多くの点で文字認識システム1のそれらと共通しているため、以下、文字認識システム2が文字認識システム1と異なる点のみ説明する。また、図3において、文字認識システム1の構成部に対応する構成部には図1において用いられたものと同じ符号が付されている。
図3は本発明の第2実施形態にかかる文字認識システム2の構成を示したブロック図である。文字認識システム2は、活字文字および手書文字に加え、写真や円グラフ等の絵柄およびグラフの縦軸・横軸や棒グラフ等の線分の混在した紙面から光学的に読み取られた画像データから当該画像データにより示される文字を認識し、認識した文字を示すテキストデータを生成するシステムである。文字認識システム2の構成および動作は多くの点で文字認識システム1のそれらと共通しているため、以下、文字認識システム2が文字認識システム1と異なる点のみ説明する。また、図3において、文字認識システム1の構成部に対応する構成部には図1において用いられたものと同じ符号が付されている。
文字認識システム2は、文字認識システム1の画像分離装置11の代わりに、画像分離装置21を備えている。画像分離装置21は画像分離装置21の構成部を制御する制御部211を備えている。制御部211は、画像分離装置11の制御部111が備えるものと同じ明度画像データ取得部1111を備えている。明度画像データ取得部1111はスキャナ10から活字文字、手書文字、絵柄および線分を含む画像を示す明度画像データを受信する。
制御部211は明度画像データに対し画像分離装置11のエッジ画像データ生成部1112と同様のエッジ抽出処理を行う全領域エッジ画像データ生成部2111を備えている。全領域エッジ画像データ生成部2111により生成される画像データは、明度画像データにより示される活字文字、手書文字、絵柄および線分の全てに関しそれらのエッジ領域を示す2値画像データである。以下、全領域エッジ画像データ生成部2111により生成される2値画像データを「全領域エッジ画像データ」と呼ぶ。
制御部211は、明度画像データに対し網点領域の抽出処理を行う網点領域画像データ生成部2112を備えている。網点領域とは、所定の閾値以上の明度を示す画素と所定の閾値未満の明度を示す画素が所定の範囲内の密度で散在し、全体として濃淡のある画像を示している領域であり、例えば写真画像のあるものは網点領域を構成する。網点領域画像データ生成部2112は、例えば明度画像データにより示される画像を構成するオン画素のうち隣接するオン画素がない孤立画素の密度が所定範囲内である領域を網点領域と認識し、網点領域に配置される画素に対応する画素データとしてオン画素データを生成し、網点領域以外に配置される画素に対応する画素データとしてオフ画素データを生成する。以下、網点領域画像データ生成部2112により生成される2値画像データを「網点領域画像データ」と呼ぶ。
制御部211は、明度画像データに対し高濃度領域の抽出処理を行う高濃度領域画像データ生成部2113を備えている。高濃度領域とは、ほぼ一様の明度を示す画素データが連続する領域や、ほぼ一定の変化率で変化する明度を示す画素データが連続する領域であり、例えば棒グラフの棒のように特定の明度で一様に塗られた図形やグラデーションにより塗られた図形等が高濃度領域を構成する。高濃度領域画像データ生成部2113は、例えば明度画像データにより示される明度が所定の閾値以上であり、かつそれらの変化率が変化しない連続する領域を高濃度領域と認識し、高濃度領域に配置される画素に対応する画素データとしてオン画素データを生成し、高濃度領域以外に配置される画素に対応する画素データとしてオフ画素データを生成する。以下、そのようにして高濃度領域画像データ生成部2113により生成される2値画像データを「高濃度領域画像データ」と呼ぶ。
制御部211は、全領域エッジ画像データ、網点領域画像データおよび高濃度領域画像データの論理和を示す画像データを生成する全領域画像データ生成部2114を備えている。全領域画像データ生成部2114は、全領域エッジ画像データ生成部2111、網点領域画像データ生成部2112および高濃度領域画像データ生成部2113からそれぞれ全領域エッジ画像データ、網点領域画像データおよび高濃度領域画像データを受け取り、それらの画像データにより示される画像に含まれる同じ位置に配置される画素のいずれかがオン画素であればその画素に対応する画素データとしてオン画素データを生成し、それ以外の場合にはオフ画素データを生成する。そのようにして生成されるデータは、明度画像データにより示される画像に含まれる活字文字、手書文字、絵柄および線分のすべての領域を示す2値画像データである。以下、全領域画像データ生成部2114により生成される2値画像データを「全領域画像データ」と呼ぶ。
制御部211は、全領域画像データに対し収縮処理を行った後に膨張処理を行う絵柄領域画像データ生成部2115を備えている。絵柄領域画像データ生成部2115は、全領域画像データ生成部2114から全領域画像データを受け取り、受け取った全領域画像データにより示される画像を構成する互いに隣接するオン画素の集まり(以下、「オン画素連続領域」と呼ぶ)の各々に関し、オン画素連続領域の外縁部に配置されているオン画素をオフ画素に書き換えることにより、オン画素連続領域を収縮させる処理を行う。その収縮処理により、全領域画像データにより示される画像に含まれる細い線は消滅する。なお、上記収縮処理は必要に応じて、複数回繰り返しても良い。
続いて、絵柄領域画像データ生成部2115は収縮処理により得られた画像に含まれるオン画素連続領域の各々に関し、オン画素連続領域の外縁部に隣接して配置されているオフ画素をオン画素に書き換えることにより、オン画素連続領域を膨張させる処理を行う。その膨張処理により、先の収縮処理により消滅しなかったオン画素連続領域は、ほぼ収縮処理の前の状態に戻る。絵柄領域画像データ生成部2115はそのようにして得られた画像を示す画像データを生成する。絵柄領域画像データ生成部2115により生成される画像データは、明度画像データにより示される画像のうち、活字文字、手書文字および線分といった細い線の領域を取り除き絵柄の領域のみを取り出して示す2値画像データである。以下、絵柄領域画像データ生成部2115により生成される2値画像データを「絵柄領域画像データ」と呼ぶ。なお、上記膨張処理は必要に応じて、複数回繰り返しても良い。
制御部211は、絵柄領域画像データに対し反転処理を行う絵柄外領域画像データ生成部2116を備えている。絵柄外領域画像データ生成部2116は、絵柄領域画像データ生成部2115から絵柄領域画像データを受け取り、受け取った絵柄領域画像データに含まれるオン画素データをオフ画素データに書き換え、オフ画素データをオン画素データに書き換えることにより新たな画像データを生成する。絵柄外領域画像データ生成部2116により生成される画像データは明度画像データにより示される画像のうち、絵柄の領域以外の領域を示す2値画像データである。以下、絵柄外領域画像データ生成部2116により生成される2値画像データを「絵柄外領域画像データ」と呼ぶ。
制御部211は、全領域画像データと絵柄外領域画像データの論理積を示す画像データを生成するエッジ画像データ生成部2117を備えている。エッジ画像データ生成部2117は、全領域画像データ生成部2114および絵柄外領域画像データ生成部2116からそれぞれ全領域画像データおよび絵柄外領域画像データを受け取り、それらの画像データにより示される画像に含まれる同じ位置に配置される画素がいずれもオン画素であればその画素に対応する画素データとしてオン画素データを生成し、それ以外の場合にはオフ画素データを生成する。
上記のようにエッジ画像データ生成部2117により生成されるデータは、全領域画像データにより示される活字文字、手書文字、絵柄および線分の領域のうち、絵柄の領域を取り除いた領域を示す2値画像データである。より具体的には、全領域エッジ画像データ生成部2111によるエッジ抽出処理が行われた画像データのうち、ほぼ、活字文字、手書文字および線分の領域の部分を取り出したものとなる。以下、エッジ画像データ生成部2117により生成される2値画像データを「エッジ画像データ」と呼ぶ。なお、エッジ画像データ生成部2117により生成されるエッジ画像データは、以下の処理において、画像分離装置11のエッジ画像データ生成部1112により生成されるエッジ画像データと同様の役割を果たす。
画像分離装置21の制御部211は、画像分離装置11の制御部111が備えるものと同様の動的閾値2値画像データ生成部1113を備えている。動的閾値2値画像データ生成部1113は、明度画像データ取得部1111より明度画像データを受け取り、受け取った明度画像データに対し動的閾値2値化処理を行い、動的閾値2値画像データを生成する。
制御部211は、動的閾値2値画像データにより示される画像の輪郭を示す画像を生成する輪郭画像データ生成部2118を備えている。第1実施形態の説明において述べたように、動的閾値2値データは、手書文字領域に関しては、エッジ画像データにより示される位置とは異なる位置に背景領域との境界線を示すデータであるが、手書文字であっても用いられた筆記具の特性等により比較的境界における明度の変化が急峻であるような場合、動的閾値2値データとエッジ画像データとの間に重複する領域が生じてしまう。輪郭画像データ生成部2118は、動的閾値2値データにより示される境界線の輪郭を取る処理により、動的閾値2値データにより示される境界線とは異なる線幅や位置の境界線を示す画像データを生成する。画像分離装置21においては、以下の処理において画像分離装置11における動的閾値2値画像データの代わりに輪郭画像データを用いることにより、より高い精度で手書文字を示す画像データの分離生成を行う。
輪郭画像データ生成部2118は、動的閾値2値画像データ生成部1113より動的閾値2値画像データを受け取り、受け取った動的閾値2値画像データにより示される画像を構成する任意の画素を注目画素として選択し、注目画素を中心とする所定範囲の領域に配置される画素が全てオン画素であるか、もしくは全てオフ画素である場合にはその注目画素に対応する画素データとしてオフ画素データを生成し、それ以外の場合にはオン画素データを生成する。そのようにして輪郭画像データ生成部2118により生成される2値画像データを以下「輪郭画像データ」と呼ぶ。
画像分離装置21の制御部211は、画像分離装置11の制御部111が備えるものと同様の手書文字除去画像データ生成部1114を備えている。ただし、制御部211が備える手書文字除去画像データ生成部1114は、動的閾値2値画像データ生成部1113により生成された動的閾値2値画像データの代わりに輪郭画像データ生成部2118により生成された輪郭画像データを用いる。具体的には、手書文字除去画像データ生成部1114はエッジ画像データ生成部2117および輪郭画像データ生成部2118からそれぞれエッジ画像データおよび輪郭画像データを受け取り、各々の画素について受け取ったそれらのデータの論理積を示す2値画像データを手書文字除去画像データとして生成する。
画像分離装置21の制御部211は、画像分離装置11の制御部111が備えるものと同様の手書文字画像データ生成部1115を備えている。すなわち、手書文字画像データ生成部1115は各々の画素について、エッジ画像データ生成部2117から受け取ったエッジ画像データから、手書文字除去画像データ生成部1114から受け取った手書文字除去画像データを差し引いた値を示す2値画像データを手書文字画像データとして生成する。そのように生成された手書文字画像データは、手書文字画像データ出力部1117により入出力インタフェース112を介して文字認識処理装置12に送信される。
一方、手書文字除去画像データ生成部1114により生成された手書文字除去画像データは、第1実施形態の説明において述べたように、活字文字の形状を示す2値画像データであるが、明度画像データにより示される画像に線分が含まれている場合、その線分の形状を示すデータが手書文字除去画像データには混在している。そこで、制御部211は手書文字除去画像データにより示される画像から活字文字を示す画像データを分離生成するために、セグメント認識部2119、形状特性抽出部2120および活字文字画像データ生成部2121を備えている。
セグメント認識部2119は、手書文字除去画像データにより示される画像に含まれる互いに隣接もしくは近接するオン画素の集まりをセグメントとして認識する。セグメントとは、この場合、1文字の活字もしくは1本の線分を示すと推定されるオン画素の集まりのことである。セグメント認識部2119は、例えば、手書文字除去画像データにより示される画像を構成する任意のオン画素を選択し、そのオン画素に連続して配置されている一連のオン画素をさらに選択する。続いてセグメント認識部2119はそのようにして選択した互いに連続するオン画素の集まりに外接する矩形を特定し、その矩形の内側の領域に配置されたオン画素の集まりを1つのセグメントとして認識する。セグメント認識部2119は認識したセグメントを示すデータを形状特性抽出部2120に引き渡す。
形状特性抽出部2120はセグメントにより示される画像の形状に関する特性を抽出する。セグメントにより示される画像の形状に関する特性としては様々なものが考えられるが、例えば外接する矩形の縦横比が利用可能である。線分は活字文字と比較して、縦横比が大きいためである。また、セグメントにより示される画像の形状に関する特性として、線幅の均一性や直線性も利用可能である。線分は活字文字と比較して線幅の均一性や直線性が高いためである。線幅の均一性や直線性を形状特性として抽出する場合、形状特性抽出部2120は、例えば各々のセグメントに含まれるオン画素の各々に関する直近のオフ画素までの距離(もしくは画素数)を算出し、その値の極値の分散を線幅の均一性を示す指標として、また極値をとる画素間のベクトルの分散を直線性を示す指標として、それぞれ抽出する。
活字文字画像データ生成部2121は、形状特性抽出部2120により抽出されたセグメントの形状特性に基づき、活字文字を示す画像データを生成する。より具体的には、活字文字画像データ生成部2121は形状特性抽出部2120により抽出された縦横比が所定の閾値以下であるものや、線幅の均一性もしくは線幅の直線性が所定の閾値以下のセグメントを活字文字を示すセグメントと判定し、それ以外を線分を示すセグメントと判定する。活字文字画像データ生成部2121は活字文字を示すと判定したセグメントの集まりを示す2値画像データを活字文字画像データとして生成する。
制御部211は活字文字画像データを出力する活字文字画像データ出力部2122を備えている。活字文字画像データ出力部2122は活字文字画像データ生成部2121により生成された活字文字画像データを、入出力インタフェース112を介して文字認識処理装置12に送信する。
文字認識処理装置12は、画像分離装置21の手書文字画像データ出力部1117および活字文字画像データ出力部2122からそれぞれ、手書文字画像データおよび活字文字画像データを受信し、それらの画像データにより示される画像に対し、手書文字用の文字認識処理および活字文字用の文字認識処理を行う。その結果、活字文字、手書文字、絵柄および線分が混在する画像から、高い精度で文字の認識が行われる。
[3.変形例]
上述した実施形態には、本発明の技術的思想の範囲内において様々に変形を加えることができる。以下、そのような変形例を示す。
上述した実施形態には、本発明の技術的思想の範囲内において様々に変形を加えることができる。以下、そのような変形例を示す。
上記において説明した文字認識システム1において、以下の3つのエッジ画像データは同じものとした。
(1−1)手書文字除去画像データ生成部1114から手書文字除去画像データ出力部1116に引き渡される手書文字除去画像データの生成用として、エッジ画像データ生成部1112から手書文字除去画像データ生成部1114に対し提供されるエッジ画像データ。
(1−2)手書文字画像データを生成するために用いられる手書文字除去画像データの生成用として、エッジ画像データ生成部1112から手書文字除去画像データ生成部1114に対し提供されるエッジ画像データ。
(1−3)手書文字画像データの生成用として、エッジ画像データ生成部1112から手書文字画像データ生成部1115に対し提供されるエッジ画像データ。
(1−1)手書文字除去画像データ生成部1114から手書文字除去画像データ出力部1116に引き渡される手書文字除去画像データの生成用として、エッジ画像データ生成部1112から手書文字除去画像データ生成部1114に対し提供されるエッジ画像データ。
(1−2)手書文字画像データを生成するために用いられる手書文字除去画像データの生成用として、エッジ画像データ生成部1112から手書文字除去画像データ生成部1114に対し提供されるエッジ画像データ。
(1−3)手書文字画像データの生成用として、エッジ画像データ生成部1112から手書文字画像データ生成部1115に対し提供されるエッジ画像データ。
同様に、上記において説明した文字認識システム2において、以下の3つのエッジ画像データは同じものとした。
(2−1)手書文字除去画像データ生成部1114からセグメント認識部2119に引き渡される手書文字除去画像データの生成用として、エッジ画像データ生成部2117から手書文字除去画像データ生成部1114に対し提供されるエッジ画像データ。
(2−2)手書文字画像データを生成するために用いられる手書文字除去画像データの生成用として、エッジ画像データ生成部2117から手書文字除去画像データ生成部1114に対し提供されるエッジ画像データ。
(2−3)手書文字画像データの生成用として、エッジ画像データ生成部2117から手書文字画像データ生成部1115に対し提供されるエッジ画像データ。
(2−1)手書文字除去画像データ生成部1114からセグメント認識部2119に引き渡される手書文字除去画像データの生成用として、エッジ画像データ生成部2117から手書文字除去画像データ生成部1114に対し提供されるエッジ画像データ。
(2−2)手書文字画像データを生成するために用いられる手書文字除去画像データの生成用として、エッジ画像データ生成部2117から手書文字除去画像データ生成部1114に対し提供されるエッジ画像データ。
(2−3)手書文字画像データの生成用として、エッジ画像データ生成部2117から手書文字画像データ生成部1115に対し提供されるエッジ画像データ。
しかしながら、文字認識システム1において、エッジ画像データ生成部1112が上記(1−1)〜(1−3)の各々のエッジ画像データを生成する際に用いる閾値等のパラメータを適するものに変更することにより、それらのエッジ画像データの内容を異なるものとするようにしてもよい。同様に、文字認識システム2において、全領域エッジ画像データ生成部2111、網点領域画像データ生成部2112および高濃度領域画像データ生成部2113の少なくとも1つが、上記(2−1)〜(2−3)の各々のエッジ画像データの生成のために用いられる全領域エッジ画像データ、網点領域画像データもしくは高濃度領域画像データの生成時の閾値や周辺領域の面積等のパラメータを適するものに変更することにより、それらのエッジ画像データの内容を異なるものとするようにしてもよい。
例えば、上記(1−1)および(2−1)のエッジ画像データは、活字文字を示す画像を抽出するためのものであるので、手書文字や絵柄を示す画像が一部欠落していても問題ないが、活字文字を示す画像は欠落していてはならない。一方、上記(1−3)および(2−3)のエッジ画像データは手書文字を示す画像を抽出するためのものであるので、手書文字を示す画像は欠落してはならないが、活字文字や絵柄を示す画像が一部欠落していても問題がない。従って、画像分離装置11のエッジ画像データ生成部1112もしくは画像分離装置21の全領域エッジ画像データ生成部2111、網点領域画像データ生成部2112および高濃度領域画像データ生成部2113がそれぞれの目的にチューニングされたパラメータを用いてデータ生成を行う結果、文字認識システム1もしくは文字認識システム2において、より精度の高い文字認識が行われることになる。
また、上記の説明においては、明度画像データから2値画像データを生成する際に、明度の所定の閾値以上のものをオン画素、明度が所定の閾値未満のものをオフ画素としたが、明度の所定の閾値以上のものをオフ画素、明度が所定の閾値未満のものをオン画素としてもよい。これらは明暗のいずれを高低とするか、という設計事項であり、本発明の技術的思想に影響を与えない。
また、上記の説明において、画像分離装置21はセグメント認識部2119、形状特性抽出部2120、活字文字画像データ生成部2121および活字文字画像データ出力部2122を備えるものとしたが、スキャナ10により読み取られる紙面に線分が含まれていないような場合、それらの構成部は不要であり、画像分離装置11と同様に、手書文字除去画像データ生成部1114により生成された手書文字除去画像データを活字文字を示す画像データとして文字認識処理装置12に対し送信すればよい。
また、上記の説明において、画像分離装置11もしくは画像分離装置21は、エッジ画像データ生成部1112もしくは全領域エッジ画像データ生成部2111によってエッジ抽出処理により明度画像データにより示される画像が不連続的に変化している箇所を特定する一方で、動的閾値2値画像データ生成部1113によって動的閾値2値化処理を行うことにより、明度画像データにより示される画像が不連続的に変化している箇所を特定し、それらの差異により活字文字の画像と手書文字の画像との分離を行うものとした。しかしながら、動的閾値2値画像データ生成部1113により動的閾値2値化処理を行い動的閾値2値画像データを生成する代わりに、例えば2次微分フィルタ、pタイル法、判別分析法等の他の方法により、エッジ抽出処理とは異なる方法で明度画像データにより示される画像が不連続的に変化している箇所を示す2値画像データを生成するようにしてもよい。
ところで、上述した画像分離装置11および画像分離装置21は、いずれも専用のハードウェアにより実現されてもよいし、汎用的なPC(Personal Computer)にアプリケーションプログラムに従った処理を実行させることにより実現されてもよい。
また、上述した実施形態においては、本発明にかかる文字認識システムを画像分離装置とそれに接続されたスキャナおよび文字認識装置により実現するものとして説明したが、それらの構成要素の配置は任意に変更可能である。例えば、文字認識装置を画像分離装置と同じ筐体に配置するようにしたり、画像分離装置をスキャナと同じ筐体に配置したりしてもよい。また、スキャナ、画像分離装置および文字認識装置を互いにネットワークを介して相互接続するようにしてもよい。
なお、上述した実施形態において説明したエッジ抽出処理、動的閾値2値化処理、網点領域抽出処理、高濃度領域抽出処理および輪郭領域抽出処理等の具体的方法は例示であって、同様の結果をもたらす既存の処理方法を任意に本発明に採用することが可能である。
1・2…文字認識システム、10…スキャナ、11・21…画像分離装置、12…文字認識処理装置、111・211…制御部、112…入出力インタフェース、113…記憶部、1111…明度画像データ取得部、1112・2117…エッジ画像データ生成部、1113…動的閾値2値画像データ生成部、1114…手書文字除去画像データ生成部、1115…手書文字画像データ生成部、1116…手書文字除去画像データ出力部、1117…手書文字画像データ出力部、2111…全領域エッジ画像データ生成部、2112…網点領域画像データ生成部、2113…高濃度領域画像データ生成部、2114…全領域画像データ生成部、2115…絵柄領域画像データ生成部、2116…絵柄外領域画像データ生成部、2118…輪郭画像データ生成部、2119…セグメント認識部、2120…形状特性抽出部、2121…活字文字画像データ生成部、2122…活字文字画像データ出力部
Claims (12)
- 平面上に規則的に配置された画素の各々の明度を示す画素明度データの集まりにより単色の画像を示す明度画像データを取得する明度画像データ取得手段と、
前記明度画像データ取得手段により取得された明度画像データにより示される画像において明度の変化率が閾値以上である領域の画素をオン画素とし他の画素をオフ画素とすることにより、エッジ領域を2値で表現するエッジ画像データを生成するエッジ画像データ生成手段と、
前記エッジ画像データ生成手段による場合とは異なる方法により、前記明度画像データ取得手段により取得された明度画像データにより示される画像において明度が非連続的に変化している領域を2値で表現する2値画像データを生成する2値画像データ生成手段と、
前記エッジ画像データ生成手段により生成されたエッジ画像データおよび前記2値画像データ生成手段により生成された2値画像データの各々により示される画像の同じ位置の画素がともにオン画素である場合には当該画素をオン画素としそれ以外の場合には当該画素をオフ画素とすることにより、手書文字除去画像データを生成する手書文字除去画像データ生成手段と
を備えることを特徴とする画像分離装置。 - 平面上に規則的に配置された画素の各々の明度を示す画素明度データの集まりにより単色の画像を示す明度画像データを取得する明度画像データ取得手段と、
前記明度画像データ取得手段により取得された明度画像データにより示される画像において明度の変化率が閾値以上である領域の画素をオン画素とし他の画素をオフ画素とすることにより、エッジ領域を2値で表現する全領域エッジ画像データを生成する全領域エッジ画像データ生成手段と、
前記明度画像データ取得手段により取得された明度画像データにより示される画像において所定の閾値以上の明度を示すオン画素と当該所定の閾値未満の明度を示すオフ画素とが所定の条件を満たす空間的なばらつきを伴い配置されている網点領域を抽出し、抽出した網点領域に配置される画素をオン画素としそれ以外の領域に配置される画素をオフ画素とすることにより、網点領域を2値で表現する網点領域画像データを生成する網点領域画像データ生成手段と、
前記明度画像データ取得手段により取得された明度画像データにより示される画像において明度もしくは明度の変化率が所定の範囲内である画素が連続している高濃度領域を抽出し、抽出した高濃度領域に配置される画素をオン画素としそれ以外の領域に配置される画素をオフ画素とすることにより、高濃度領域を2値で表現する高濃度領域画像データを生成する高濃度領域画像データ生成手段と、
前記全領域エッジ画像データ生成手段により生成された全領域エッジ画像データと前記網点領域画像データ生成手段により生成された網点領域画像データと前記高濃度領域画像データ生成手段により生成された高濃度領域画像データの各々により示される画像の同じ位置の画素が全てオフ画素である場合には当該画素をオフ画素としそれ以外の場合にはオン画素とすることにより、全領域画像データを生成する全領域画像データ生成手段と、
前記全領域画像データ生成手段により生成された全領域画像データにより示される画像に含まれるオン画素のうち互いに連続して配置されるオン画素の集まりの外縁部に配置されるオン画素をオフ画素に変更する収縮処理を行った後に当該オン画素の集まりの外縁部に隣接するオフ画素をオン画素に変更する膨張処理を行うことにより、絵柄領域画像データを生成する絵柄領域画像データ生成手段と、
前記絵柄領域画像データ生成手段により生成された絵柄領域画像データにより示される画像のオン画素とオフ画素を互いに入れ替えることにより、絵柄外領域画像データを生成する絵柄外領域画像データ生成手段と、
前記全領域画像データ生成手段により生成された全領域画像データと前記絵柄外領域画像データ生成手段により生成された絵柄外領域画像データの各々により示される画像の同じ位置の画素がともにオン画素である場合には当該画素をオン画素としそれ以外の場合には当該画素をオフ画素とすることにより、エッジ画像データを生成するエッジ画像データ生成手段と、
前記エッジ画像データ生成手段による場合とは異なる方法により、前記明度画像データ取得手段により取得された明度画像データにより示される画像において明度が非連続的に変化している領域を2値で表現する2値画像データを生成する2値画像データ生成手段と、
前記エッジ画像データ生成手段により生成されたエッジ画像データおよび前記2値画像データ生成手段により生成された2値画像データの各々により示される画像の同じ位置の画素がともにオン画素である場合には当該画素をオン画素としそれ以外の場合には当該画素をオフ画素とすることにより、手書文字除去画像データを生成する手書文字除去画像データ生成手段と
を備えることを特徴とする画像分離装置。 - 前記2値画像データ生成手段は、前記明度画像データ取得手段により取得された明度画像データにより示される画像の注目画素の明度が当該注目画素を含む所定領域の明度に応じた閾値以上である場合には当該注目画素をオン画素としそれ以外の場合にはオフ画素とすることにより、明度が非連続的に変化している領域を2値で表現する動的閾値2値化処理手段である
ことを特徴とする請求項1および2のいずれかに記載の画像分離装置。 - 前記2値画像データ生成手段により生成された2値画像データにより示される画像の注目画素および当該注目画素の周辺の所定領域に配置される画素の全てがオフ画素である場合もしくは注目画素および当該注目画素の周辺の所定領域に配置される画素の全てがオン画素である場合には当該注目画素をオフ画素としそれ以外の場合には当該注目画素をオン画素とすることにより、輪郭画像データを生成する輪郭画像データ生成手段
を備え、
前記手書文字除去画像データ生成手段は、前記2値画像データ生成手段により生成された2値画像データの代わりに、前記輪郭画像データ生成手段により生成された輪郭画像データを用いて前記手書文字除去画像データを生成する
ことを特徴とする請求項1および2のいずれかに記載の画像分離装置。 - 前記エッジ画像データ生成手段により生成されたエッジ画像データおよび前記手書文字除去画像データ生成手段により生成された手書文字除去画像データに関し、当該エッジ画像データにより示される画像の注目画素がオン画素でありかつ当該手書文字除去画像データにより示される画像の当該注目画素と同じ位置の画素がオフ画素である場合には当該注目画素をオン画素としそれ以外の場合には当該画素をオフ画素とすることにより、手書文字画像データを生成する手書文字画像データ生成手段
を備えることを特徴とする請求項1乃至4のいずれかに記載の画像分離装置。 - 前記手書文字除去画像データ生成手段による手書文字除去画像データの生成において用いられるエッジ画像データと前記手書文字画像データ生成手段による手書文字画像データの生成において用いられるエッジ画像データは、互いに異なるパラメータを用いて生成された異なるデータである
ことを特徴とする請求項5に記載の画像分離装置。 - 前記手書文字除去画像データ生成手段により生成された手書文字除去画像データにより示される画像に含まれるオン画素のうち互いに隣接もしくは近接するオン画素の集まりをセグメントとして認識するセグメント認識手段と、
前記セグメント認識手段により認識されたセグメントの形状に関する特性を抽出する形状特性抽出手段と、
前記形状特性抽出手段により抽出された特性に基づき、前記セグメント認識手段により認識されたセグメントの集まりから活字文字を示すセグメントを抽出し、抽出したセグメントの集まりを示す活字文字画像データを生成する活字文字画像データ生成手段と
を備えることを特徴とする請求項1乃至4のいずれかに記載の画像分離装置。 - 前記形状特性抽出手段は、セグメントの縦横比、幅の均一性および直線性の少なくとも1つを当該セグメントの形状に関する特性として抽出する
ことを特徴とする請求項7に記載の画像分離装置。 - 平面上に規則的に配置された画素の各々の明度を示す画素明度データの集まりにより単色の画像を示す明度画像データを取得する明度画像データ取得過程と、
前記明度画像データ取得過程において取得された明度画像データにより示される画像において明度の変化率が閾値以上である領域の画素をオン画素とし他の画素をオフ画素とすることにより、エッジ領域を2値で表現するエッジ画像データを生成するエッジ画像データ生成過程と、
前記エッジ画像データ生成過程における場合とは異なる方法により、前記明度画像データ取得過程において取得された明度画像データにより示される画像において明度が非連続的に変化している領域を2値で表現する2値画像データを生成する2値画像データ生成過程と、
前記エッジ画像データ生成過程において生成されたエッジ画像データおよび前記2値画像データ生成過程において生成された2値画像データの各々により示される画像の同じ位置の画素がともにオン画素である場合には当該画素をオン画素としそれ以外の場合には当該画素をオフ画素とすることにより、手書文字除去画像データを生成する手書文字除去画像データ生成過程と
を備えることを特徴とする画像分離方法。 - 平面上に規則的に配置された画素の各々の明度を示す画素明度データの集まりにより単色の画像を示す明度画像データを取得する明度画像データ取得過程と、
前記明度画像データ取得過程において取得された明度画像データにより示される画像において明度の変化率が閾値以上である領域の画素をオン画素とし他の画素をオフ画素とすることにより、エッジ領域を2値で表現する全領域エッジ画像データを生成する全領域エッジ画像データ生成過程と、
前記明度画像データ取得過程において取得された明度画像データにより示される画像において所定の閾値以上の明度を示すオン画素と当該所定の閾値未満の明度を示すオフ画素とが所定の条件を満たす空間的なばらつきを伴い配置されている網点領域を抽出し、抽出した網点領域に配置される画素をオン画素としそれ以外の領域に配置される画素をオフ画素とすることにより、網点領域を2値で表現する網点領域画像データを生成する網点領域画像データ生成過程と、
前記明度画像データ取得過程において取得された明度画像データにより示される画像において明度もしくは明度の変化率が所定の範囲内である画素が連続している高濃度領域を抽出し、抽出した高濃度領域に配置される画素をオン画素としそれ以外の領域に配置される画素をオフ画素とすることにより、高濃度領域を2値で表現する高濃度領域画像データを生成する高濃度領域画像データ生成過程と、
前記全領域エッジ画像データ生成過程において生成された全領域エッジ画像データと前記網点領域画像データ生成過程において生成された網点領域画像データと前記高濃度領域画像データ生成過程において生成された高濃度領域画像データの各々により示される画像の同じ位置の画素が全てオフ画素である場合には当該画素をオフ画素としそれ以外の場合にはオン画素とすることにより、全領域画像データを生成する全領域画像データ生成過程と、
前記全領域画像データ生成過程において生成された全領域画像データにより示される画像に含まれるオン画素のうち互いに連続して配置されるオン画素の集まりの外縁部に配置されるオン画素をオフ画素に変更する収縮処理を行った後に当該オン画素の集まりの外縁部に隣接するオフ画素をオン画素に変更する膨張処理を行うことにより、絵柄領域画像データを生成する絵柄領域画像データ生成過程と、
前記絵柄領域画像データ生成過程において生成された絵柄領域画像データにより示される画像のオン画素とオフ画素を互いに入れ替えることにより、絵柄外領域画像データを生成する絵柄外領域画像データ生成過程と、
前記全領域画像データ生成過程において生成された全領域画像データと前記絵柄外領域画像データ生成過程において生成された絵柄外領域画像データの各々により示される画像の同じ位置の画素がともにオン画素である場合には当該画素をオン画素としそれ以外の場合には当該画素をオフ画素とすることにより、エッジ画像データを生成するエッジ画像データ生成過程と、
前記エッジ画像データ生成過程における場合とは異なる方法により、前記明度画像データ取得過程において取得された明度画像データにより示される画像において明度が非連続的に変化している領域を2値で表現する2値画像データを生成する2値画像データ生成過程と、
前記エッジ画像データ生成過程において生成されたエッジ画像データおよび前記2値画像データ生成過程において生成された2値画像データの各々により示される画像の同じ位置の画素がともにオン画素である場合には当該画素をオン画素としそれ以外の場合には当該画素をオフ画素とすることにより、手書文字除去画像データを生成する手書文字除去画像データ生成過程と
を備えることを特徴とする画像分離方法。 - 平面上に規則的に配置された画素の各々の明度を示す画素明度データの集まりにより単色の画像を示す明度画像データを取得する処理と、
取得した明度画像データにより示される画像において明度の変化率が閾値以上である領域の画素をオン画素とし他の画素をオフ画素とすることにより、エッジ領域を2値で表現するエッジ画像データを生成する処理と、
前記エッジ画像データの生成における場合とは異なる方法により、前記明度画像データにより示される画像において明度が非連続的に変化している領域を2値で表現する2値画像データを生成する処理と、
生成したエッジ画像データおよび2値画像データの各々により示される画像の同じ位置の画素がともにオン画素である場合には当該画素をオン画素としそれ以外の場合には当該画素をオフ画素とすることにより、手書文字除去画像データを生成する処理と
をコンピュータに実行させることを特徴とするプログラム。 - 平面上に規則的に配置された画素の各々の明度を示す画素明度データの集まりにより単色の画像を示す明度画像データを取得する処理と、
取得した明度画像データにより示される画像において明度の変化率が閾値以上である領域の画素をオン画素とし他の画素をオフ画素とすることにより、エッジ領域を2値で表現する全領域エッジ画像データを生成する処理と、
取得した明度画像データにより示される画像において所定の閾値以上の明度を示すオン画素と当該所定の閾値未満の明度を示すオフ画素とが所定の条件を満たす空間的なばらつきを伴い配置されている網点領域を抽出し、抽出した網点領域に配置される画素をオン画素としそれ以外の領域に配置される画素をオフ画素とすることにより、網点領域を2値で表現する網点領域画像データを生成する処理と、
取得した明度画像データにより示される画像において明度もしくは明度の変化率が所定の範囲内である画素が連続している高濃度領域を抽出し、抽出した高濃度領域に配置される画素をオン画素としそれ以外の領域に配置される画素をオフ画素とすることにより、高濃度領域を2値で表現する高濃度領域画像データを生成する処理と、
生成した全領域エッジ画像データと網点領域画像データと高濃度領域画像データの各々により示される画像の同じ位置の画素が全てオフ画素である場合には当該画素をオフ画素としそれ以外の場合にはオン画素とすることにより、全領域画像データを生成する処理と、
生成した全領域画像データにより示される画像に含まれるオン画素のうち互いに連続して配置されるオン画素の集まりの外縁部に配置されるオン画素をオフ画素に変更する収縮処理を行った後に当該オン画素の集まりの外縁部に隣接するオフ画素をオン画素に変更する膨張処理を行うことにより、絵柄領域画像データを生成する処理と、
生成した絵柄領域画像データにより示される画像のオン画素とオフ画素を互いに入れ替えることにより、絵柄外領域画像データを生成する処理と、
生成した全領域画像データと絵柄外領域画像データの各々により示される画像の同じ位置の画素がともにオン画素である場合には当該画素をオン画素としそれ以外の場合には当該画素をオフ画素とすることにより、エッジ画像データを生成する処理と、
前記エッジ画像データの生成における場合とは異なる方法により、前記明度画像データにより示される画像において明度が非連続的に変化している領域を2値で表現する2値画像データを生成する処理と、
生成したエッジ画像データおよび2値画像データの各々により示される画像の同じ位置の画素がともにオン画素である場合には当該画素をオン画素としそれ以外の場合には当該画素をオフ画素とすることにより、手書文字除去画像データを生成する処理と
をコンピュータに実行させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005093261A JP2006277150A (ja) | 2005-03-28 | 2005-03-28 | 画像分離装置、画像分離方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005093261A JP2006277150A (ja) | 2005-03-28 | 2005-03-28 | 画像分離装置、画像分離方法およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006277150A true JP2006277150A (ja) | 2006-10-12 |
Family
ID=37211874
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005093261A Withdrawn JP2006277150A (ja) | 2005-03-28 | 2005-03-28 | 画像分離装置、画像分離方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006277150A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009271657A (ja) * | 2008-05-02 | 2009-11-19 | Canon Inc | 画像処理方法、画像処理装置、及び、そのプログラムならびにコンピュータ読み取り可能な記憶媒体 |
JP2015225516A (ja) * | 2014-05-28 | 2015-12-14 | 沖電気工業株式会社 | 認識装置、認識方法、プログラムおよび認識システム |
-
2005
- 2005-03-28 JP JP2005093261A patent/JP2006277150A/ja not_active Withdrawn
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009271657A (ja) * | 2008-05-02 | 2009-11-19 | Canon Inc | 画像処理方法、画像処理装置、及び、そのプログラムならびにコンピュータ読み取り可能な記憶媒体 |
US8520951B2 (en) | 2008-05-02 | 2013-08-27 | Canon Kabushiki Kaisha | Image processing method, image processing apparatus, and computer readable storage medium |
JP2015225516A (ja) * | 2014-05-28 | 2015-12-14 | 沖電気工業株式会社 | 認識装置、認識方法、プログラムおよび認識システム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7054485B2 (en) | Image processing method, apparatus and system | |
JP6139396B2 (ja) | 文書を表す二値画像を圧縮する方法及びプログラム | |
US7376272B2 (en) | Method for image segmentation to identify regions with constant foreground color | |
US8947736B2 (en) | Method for binarizing scanned document images containing gray or light colored text printed with halftone pattern | |
JP5274495B2 (ja) | 文書画像サイズ変更方法 | |
US7805022B2 (en) | Image processing apparatus, image processing method and computer program | |
JP2009265751A (ja) | 文字認識装置、光学式文字認識システム及び文字認識プログラム | |
JP4655335B2 (ja) | 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 | |
US20210064859A1 (en) | Image processing system, image processing method, and storage medium | |
JP6122988B1 (ja) | 画像処理装置、画像処理方法、および、プログラム | |
JP4613397B2 (ja) | 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 | |
US8229214B2 (en) | Image processing apparatus and image processing method | |
JP2010074342A (ja) | 画像処理装置、画像形成装置、及びプログラム | |
US9338310B2 (en) | Image processing apparatus and computer-readable medium for determining pixel value of a target area and converting the pixel value to a specified value of a target image data | |
JP2006277150A (ja) | 画像分離装置、画像分離方法およびプログラム | |
JP2005303740A (ja) | 画像形成装置、画像形成方法およびプログラム | |
JP2020086850A (ja) | 情報処理装置、情報処理方法およびプログラム、並びに、画像形成システム | |
JP2003046746A (ja) | 画像処理方法及び画像処理装置 | |
JP5767549B2 (ja) | 画像処理装置、画像処理方法、およびプログラム | |
JP2002175532A (ja) | 画像処理装置、画像処理方法および画像処理プログラムを記録した記憶媒体 | |
JP2020154449A (ja) | 画像処理装置及びプログラム | |
JP2006201885A (ja) | 画像判断装置、画像形成装置、画像判断方法、画像判断プログラム、画像形成プログラムおよびコンピュータ読取り可能な記録媒体 | |
JPH0916713A (ja) | 画像領域分割方法 | |
JP2006092345A (ja) | 文字認識装置、文字認識方法および文字認識プログラム | |
US8340434B2 (en) | Image processing apparatus, image processing system and computer readable medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080221 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20100315 |