JP4371911B2 - 関数化処理方法及び関数化処理装置 - Google Patents

関数化処理方法及び関数化処理装置 Download PDF

Info

Publication number
JP4371911B2
JP4371911B2 JP2004161571A JP2004161571A JP4371911B2 JP 4371911 B2 JP4371911 B2 JP 4371911B2 JP 2004161571 A JP2004161571 A JP 2004161571A JP 2004161571 A JP2004161571 A JP 2004161571A JP 4371911 B2 JP4371911 B2 JP 4371911B2
Authority
JP
Japan
Prior art keywords
contour
contacts
extracting
contact
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004161571A
Other languages
English (en)
Other versions
JP2005346137A5 (ja
JP2005346137A (ja
Inventor
充 鵜沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2004161571A priority Critical patent/JP4371911B2/ja
Priority to US11/109,851 priority patent/US7873218B2/en
Publication of JP2005346137A publication Critical patent/JP2005346137A/ja
Publication of JP2005346137A5 publication Critical patent/JP2005346137A5/ja
Application granted granted Critical
Publication of JP4371911B2 publication Critical patent/JP4371911B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Image Generation (AREA)
  • Image Analysis (AREA)

Description

本発明は、スキャナ等の画像読取装置より読み込まれた紙文書のオブジェクトに対してアウトライン化を行う方法に関し、特にオブジェクトのアウトラインを直線、及びベジェ曲線により近似する方法に関する。
近年、情報の電子化が進み、文書を紙ではなく電子化して保存或いは送信するシステムが急速に普及している。特に、フルカラーの文書を保存、送信に適した電子データとしては、紙原稿を文字、表、図等のオブジェクトへ像域分離し、各オブジェクトに適した形態でデータ化したベクトルデータが適しており、データ量を削減できるだけでなく再利用性が高い。
ここで、文字、表、線等のオブジェクトは、オブジェクトの外形をアウトライン化し、直線及び曲線により表現された形態へ変換することにより、各オブジェクトのデータ量を軽減できるだけでなく、文字は解像度に依存しない高画質な電子データへ、また表、線等の図形要素は、要素毎の編集が簡便な電子データへ変換することができる。
ところで、上述したような直線及び曲線への変換処理にあっては、今まで多くの方法が検討されている。それらの方法の多くは、まず輪郭線を表す点列を各セグメントへ分割し、次に各セグメントを曲線或いは直線へ変換する方法が採用されている。
例えば、輪郭線を一旦直線近似し、直線の組み合わせとして表現し、分割後、Bスプライン曲線、ベジェ曲線等で補間処理し、直線を滑らかな曲線に置き換える、という方法がある。直線近似処理には、区分分割手法が一般的な方法として挙げられているが、他にも例えば、非特許文献1、2に記載された方法がある。
また、輪郭線を分割する方法については、細かなショートベクトルで表現された輪郭線に対し、注目点からの角度に基づいて輪郭線を分割する方法(例えば、特許文献1参照)が開示されている。尚、ここでの補間方法としては、非特許文献3が紹介されている。
また、点列における曲線の接線方向の角度変化に着目し、曲線を分割し曲線を分割する点列を生成し、近似処理では連続する3点よりその3点位置における比率を求め、2つの曲線を決定する簡易的な方法(例えば、特許文献2参照)が提案されている。
また、補間方法として、有理型二次ベジェ曲線を用いる方法(例えば、特許文献3参照)が提案されている。尚、分割方法については記載されていない。
一方、曲線近似処理に着目すると、分割された点列に対して非線形計画法を用いて近似を行う方法(例えば、特許文献4参照)が提案されている。
また、任意に分割された点列に対してDP(Dynamic Programming)を用いて複数の関数を用いて近似する方法(例えば、非特許文献4参照)が提案されている。
特開平3−48375号公報 特開平8−153191号公報 特開平6−282658号公報 特開平7−85110号公報 平曲面の最適折線近似(佐藤 電子通信学会論文誌'82/9Vol.J65-D No9) "Space-Efficient Outlines from Image Data via Vertex Minimization and Grid Constrains",Graphical Models and Image Processing Vol.59 No.2,pp.73-88(1997) Wolfgang BOHM:A survey of corve and surface and Geometric Design 1,1984 関数化図形表現を用いた紙文書のデジタル化(森浩一 和田耕一 寅市和男 情報処理学会研究報告Vol.99,No.57,pp17-23)
上記従来の方法を用いてアウトラインを作成することは可能であるが、ラスター画像より得られるオブジェクト全てに対し、適応的にかつ高速に処理を行う場合には種々問題が生じる。例えば、直線近似処理を用いて曲線分割を行う場合、直線近似処理は直線と点列との誤差を求め最適化するため、より精度を求めれば繰り返し演算による処理量の増加が問題となる。
また同様に、点列に対して曲線を用いて近似すれば、曲線と点列の誤差を求めて最適化するため、処理量の増加を招く。一方、繰り返し演算を必要としない点列間の角度を用いて簡易に分割する方法では、その簡易さより小さな輪郭線から大きな輪郭線に対応するのが困難である。また、ノイズ等の影響を受け易く、最適な分割を実現するためには分割前の曲線を構成する点列(ショートベクトル)を求める処理が重要となるが、この方法については開示されていない。
また、曲線近似処理でアンカーポイント間の特徴点一点を求め、3点間の距離の比率より簡易にかつ最適な曲線を求める方法も提案されているが、特徴点を新たなアンカーポイントとし、両端のアンカーポイント2つを含む3点より2つの曲線を求める処理であるため、曲線及び点の増加を招いてしまうという問題がある。
また、全ての従来方法における問題として、アウトラインを一律に評価しているため、アウトラインの大きさが大きくなれば点の増加を招き、アウトラインが極端に小さくなれば近似精度の劣化を招いてしまう。尚、それら問題への対処は開示されていない。
従って、上記従来の方法では、曲線近似においては、近似処理が重くなるという第一の課題があり、一方それを解決するような簡易な近似処理では精度が保証されないもしくはデータ量の削減が図れないという第二の課題がある。
また、全ての方法において、アウトラインを一律に評価しているためにアウトライン化する対象オブジェクトの大きさに対して精度が保証されず、大きさの変化に柔軟に対処できないという第三の課題がある。
本発明は、上記課題を解決するためになされたもので、入力された文字、図形等のオブジェクトに対して、高速に処理し、かつ少ないポイント数で高画質なアウトラインを作成することを目的とする。
本発明の関数化処理方法は、入力手段が、画像データを入力する入力工程と、2値化手段が、入力された画像データを2値化する2値化工程と、輪郭抽出手段が、2値化された画像データから画像の輪郭を抽出する輪郭抽出工程と、接点推定手段が、抽出された輪郭より接線を抽出し、抽出された接線より接点を推定する接点推定工程と、関数近似手段が、推定された接点に対して隣接する接点間の輪郭を所定の関数で近似する関数近似工程とを有し、前記接点推定工程では、水平及び垂直方向の直線パターンをパターンマッチングによって検出し、検出された直線パターンと近傍の輪郭画素との相対位置関係によって接点を推定することを特徴とする。
本発明によれば、入力された文字、図形等のオブジェクトに対して、高速に処理し、かつ少ないポイント数で高画質なアウトラインを作成することができる。
以下、図面を参照しながら発明を実施するための最良の形態について詳細に説明する。
図1は、実施例1における文書処理装置の概観を示す図である。図1において、101はコンピュータ装置であり、後述するフローチャートを参照して説明する処理を実現するためのプログラムを含む、文書の電子化処理プログラムを実行する。また、コンピュータ装置101は、ユーザに状況や画像を表示するためのディスプレイ装置102と、ユーザの操作を受け付けるキーボードやマウス等のポインティングデバイスを含んで構成される入力装置103とを付随する。このディスプレイ装置102としては、CRTやLCD等が用いられる。104はスキャナ装置であり、文書画像を光学的に読み取って電子化し、得られた画像データをコンピュータ装置101に送る。尚、スキャナ装置104としては、カラースキャナを用いるものとする。
図2は、実施例1における文書処理装置の構成を示すブロック図である。図2において、201はCPUであり、後述するROM又はRAMに格納された制御プログラムを実行することにより、後述する電子化処理を含む各種機能を実現する。202はROMであり、CPU201によって実行される各種制御プログラムや制御データが格納されている。203はRAMであり、CPU201によって実行される各種制御プログラムを格納したり、CPU201が各種処理を実行するのに必要な作業領域が定義されている。
204は外部記憶装置であり、詳細は後述する実施例1における処理をCPU101によって実現するための制御プログラムや、スキャナ装置104で読み取って得られた文書画像データ等を格納する。そして、205はコンピュータバスであり、上述した各構成を接続するものである。
図3は、文書処理装置における文書の電子化処理の概要を示す図である。ここで、電子化処理の流れは、まず入力部301において、電子化の対象とするカラー文書をスキャナ装置104を用いて読み込み、文書を画像データとして外部記憶装置204に格納する。次に、2値化処理302において、後段の像域分離処理、アウトライン生成処理のために、外部記憶装置204に格納された文書画像データに対して2値化処理を施す。そして、像域分離処理303では、2値化処理302で得られた2値画像から、文字、図、表、枠、線などの要素を抽出し、各領域に分割する。
次に、ベクトル化処理304において、領域分割された画像データに対して、文字部は文字認識部305で文字認識を行い、アウトライン作成部306でアウトラインベクトルデータへ変換する。また、表、枠、線部等は、アウトライン作成部307でアウトラインデータ化する。また、アウトライン作成部306及び307で変換された画像データは、各オブジェクトの輪郭線が滑らかな曲線により表現される高画質で、解像度に依存しない、かつ編集容易なベクトルデータへ変換される。
一方、その他の図、写真画、背景については、例えば背景については、圧縮部308でJPEG圧縮など各々に適した形態で保持、圧縮する。
次に、電子文書作成処理309は、分割された要素毎の属性に基づいて文字認識データや表構造データを用い、それぞれ変換された画像情報から電子化文書を作成する。そして、出力部310は生成された電子化文書を外部記憶装置204に格納する。
尚、出力部310の出力形態は外部記憶装置204への格納に限られるものではなく、ディスプレイ装置102へ表示したり、不図示のネットワークインターフェースを介してネットワーク上の他の装置へ出力したり、不図示のプリンタへ送出したりすることも可能である。
[2値化処理]
2値化処理302では、入力された文書画像データより輝度情報を抽出し、その輝度値のヒストグラムを作成する。ヒストグラム上より複数の閾値を設定し、各々の閾値で2値化された2値画像上の黒画素の連結等を解析することで最適な閾値を導出し、その閾値による2値画像を得る。
[像域分離処理]
像域分離処理303とは、図4に示す左側の読み取られた1ページのイメージデータをオブジェクト毎の塊(ブロック)として認識し、各々の塊を文字/図画/写真/線/表等の属性に判定し、図4に示す右側のように、異なる属性(TEXT/PICTURE/PHOTE/LINE/TABLE)を持つ領域に分割する処理である。
像域分離処理303では、2値化処理302で得られた2値画像より、黒画素の輪郭線追跡を行って黒画素輪郭で囲まれる画素の塊を抽出する。また、面積の大きい黒画素の塊については、内部にある白画素に対しても輪郭線追跡を行い、白画素の塊を抽出し、更に一定面積以上の白画素の塊の内部からは再帰的に黒画素の塊を抽出する。
このようにして得られた黒画素の塊を、大きさ及び形状で分類し、異なる属性を持つ領域へ分類していく。例えば、縦横比が1に近く、大きさが一定の範囲のものを文字相当の画素塊とし、更に近接する文字が整列良くグループ化可能な部分を文字領域、扁平な画素塊を線領域、一定の大きさ以上で、かつ四角系の白画素塊を整列よく内包する黒画素塊の占める範囲を表領域、不定形の画素塊が散在している領域を写真領域、それ以外の任意形状の画素塊を図画領域、などとする。
図5は、像域分離処理303で分離された各ブロックに対するブロック情報と入力ファイル情報を示す図である。図5に示すように、ブロック情報は、各ブロックの属性、座標(X,Y)、幅(W)、高さ(H)、OCR情報を含み、属性1は文字、属性2は図画、属性3は表、属性4は線、属性5は写真である。そして、入力ファイル情報は、ブロック総数N(図5に示す例では、ブロック1〜ブロック6までの6である)を有する。
尚、各ブロックに対して、より鮮明な2値画像を得ようとした場合は、ここでブロック毎に上述した2値化処理を行っても良い。
[文字認識]
文字認識部305では、文字単位で切り出された画像に対して、パターンマッチングの一手法を用いて認識を行い、対応する文字コードを得る。この認識処理は、文字画像から得られる特徴を数十次元の数値列に変換した観測特徴ベクトルと、予め字種毎に求められている辞書特徴ベクトルとを比較し、最も距離の近い字種を認識結果とする処理である。この特徴ベクトルの抽出には種々の公知手法があり、例えば文字をメッシュ状に分割し、各メッシュ内の文字線を方向別に線素としてカウントしたメッシュ数次元ベクトルを特徴とする方法がある。
像域分離処理303で抽出された文字領域に対して文字認識を行う場合、まず該当領域に対して横書き、縦書きの判定を行い、それぞれ対応する方向に行を切り出し、その後、文字を切り出して文字画像を得る。この横書き、縦書きの判定は、該当領域内で画素値に対する水平/垂直の射影を取り、水平射影の分散が大きい場合には横書き領域と判定し、垂直射影の分散が大きい場合には縦書き領域と判定すれば良い。また、文字列及び文字への分解は、横書きならば水平方向の射影を利用して行を切り出し、更に切り出された行に対する垂直方向の射影から、文字を切り出すことで行う。縦書きの文字領域に対しては、水平と垂直を逆にすれば良い。尚 この時、文字のサイズが検出できる。
[アウトライン生成部]
アウトライン作成部306、307では、像域分離処理で得られた文字、表、枠、線について、輪郭形状を直線及び滑らかな曲線により表現されるアウトラインベクトルデータに変換する。この手法は、オブジェクト原型よりアウトラインベクトルデータを作成する際に、画質劣化を抑えつつ、高速に処理する手法であり、詳細に説明する。
図6は、アウトライン作成部306、307の処理を示すフローチャートである。この処理の入力は、像域分離処理303で抽出された、例えば図4に示す文字(TEXT)領域の2値画像である。また、文字の場合は、文字認識部305で文字単位に切り出された画像であっても良い。
まず、ステップS601において、2値のラスター画像データを水平ベクトル及び垂直ベクトルからなるアウトラインデータ(以下、粗輪郭データと呼ぶ)へと変換する。尚、入力されるラスター画像データより抽出される粗輪郭データは一つだけとは限らず、殆どの場合、複数の粗輪郭データが抽出される。
次に、ステップS602において、抽出された粗輪郭データに対して、一粗輪郭データ毎に直線及び曲線により表現されるアウトラインベクトルデータへと変換する。
図7は、粗輪郭データ及びアウトラインベクトルデータの一例を示す図である。図7において、(a)は粗輪郭データであり、(b)はアウトラインベクトルデータである。
以下、図8及び図9を参照して図6に示すフローチャートの各ステップの処理について詳細に説明する。
ステップS601では、2値のラスター画像データを粗輪郭データへと変換する。図8は、ここで扱うラスター画像データの1画素を示す図である。図8に示すように、ラスター画像データにおける1画素は、4つの頂点を有し、垂直ベクトル及び水平ベクトルより構成される正方形として扱う。1画素を4つの頂点を有する正方形として扱い、その集合であるラスター画像データのアウトラインを抽出すると、得られるアウトラインデータは、水平ベクトル及び垂直ベクトルからなる粗輪郭データが抽出される。
このような粗輪郭データの抽出方法は、種々提案されており、特に特開平5−108823号公報に開示されている粗輪郭抽出方法を用いれば、ラスター画像一面より効率良くかつ高速に粗輪郭データを抽出することが可能である。
そして、抽出された輪郭データは、図9に示すような、水平ベクトル及び垂直ベクトルが交互に並ぶ構成である粗輪郭データとなる。この粗輪郭データの抽出では、このような水平ベクトル及び垂直ベクトルが交互に並ぶ構成となる輪郭データを抽出し、次ステップS602へ進む。
次に、ステップS602では、上述のステップS601で得られた粗輪郭データを直線及び曲線からなるアウトラインベクトルデータへと変換する。
図10は、実施例1における粗輪郭データをアウトラインベクトルデータへと変換する処理を示すフローチャートである。まず、粗輪郭データに対してノイズ除去を行い(ステップS1001)、ノイズ除去された粗輪郭上の線分より主接線線分を抽出すると共に、準接線線分を抽出する(ステップS1002)。尚、主接線線分、準接線線分については後述する。
次に、ステップS1002で抽出された主接線線分、準接線線分よりアンカーポイントを抽出し(ステップS1003)、抽出されたアンカーポイント間が数個の線分により構成されるグループを二次もしくは三次ベジェ曲線及び直線にあてはめる(ステップS1004)。次に、残りの線分についてベジェ曲線近似を行い、三次もしくは二次のベジェ曲線により置き換える(ステップS1005)。最後に、直線及び曲線より構成されるアウトラインベクトルデータに対して、補正処理を行う(ステップS1006)。
以下、図11乃至図20を参照して図10に示すフローチャートの各ステップの処理について詳細に説明する。
[ノイズ除去]
まず、ノイズ除去(ステップS1001)では、粗輪郭データよりノイズ除去を行う。図11は、除去するノイズの一例を示す図である。尚、図中の“1”は、ラスター画像における1画素大のサイズを表し、1画素サイズの凹凸を除去することを目的とする。このノイズ除去では、図11の(a)、(b)の網点ノイズ、同(c)に示す角欠けノイズを除去するが、図12に示すように、ノイズに似た粗輪郭データも存在する。特に、ここでは、小さな文字から大きな文字までを扱うことを前提としているので、図12に示す形状のものを全て除去しては画質の劣化を招く。
よって、ノイズ解析が必要であり、例えば図11に示すノイズは、それぞれ以下の条件(a)〜(c)を満たす場合に除去するものとする。
(a)1つの凸ノイズについて、次の式を満たす。
Figure 0004371911
(b)凸ノイズが複数個隣接している。
(c)次式を全て満たす。
Figure 0004371911
尚、(b)の除去手法としては、次の2つを比べ、小さい方側を凸ノイズの上辺としてノイズを除去する。
Figure 0004371911
ところで、ノイズを判断するための各パラメータα1,Θ,Θ,Θは一定値でもよいが、小さなオブジェクトから大きなオブジェクトを扱う上で、全てのオブジェクトを一律に評価することは困難であるので、より詳細に行うためには、粗輪郭データそれぞれのオブジェクトサイズに応じて変更しても良い。このオブジェクトサイズの情報、即ち、文字サイズは文字認識部305により、またアウトラインサイズは像域分離処理303で既に抽出されているので、それらを用いて簡単に閾値Θ,Θ,Θを導出することが可能である。
以上でノイズ除去が行えるが、元々粗輪郭抽出前に2値のラスター画像データにおいてノイズ除去することも可能であり、ラスター画像データでノイズ除去してあれば、ここで行わなくても良い。しかしながら、ラスター画像上でノイズを除去する場合は、画像一面を処理する必要があり、かつ上述した条件を満たす除去を行う場合は、非常に処理が重くなってしまう。これに対して、粗輪郭データでは扱うデータ量も少なくて済むので、非常に効率的である。
[接線線分抽出]
次に、ステップS1002では、ノイズ除去された粗輪郭データより、オブジェクトに対する接線線分を抽出する。接線線分とは、粗輪郭データの線分中、ある線分がそのままオブジェクト形状の接線成分となる線分である。
図13は、粗輪郭データより接線線分の抽出を説明するための図である。図13に示す(a)は元の粗輪郭データであり、図13に示す(b)の太線部が粗輪郭(a)より抽出された接線線分である。ここで、接線線分は以下の条件(1)〜(4)を満たす場合に、抽出される。
Figure 0004371911
尚、条件に使用されるパラメータθ〜θは、解像度に依存する一定値でも構わないが、文字認識部305によって抽出される文字サイズ、像域分離処理303で検出される領域サイズ、ステップS601で検出されるアウトラインサイズ等のオブジェクトサイズにより、適応的に変更しても良い。
また、各オブジェクトサイズに応じて条件(1)〜(4)のうち、適用する条件を選択しても良い。
オブジェクトのサイズにより条件を変更することで、文字サイズ、輪郭サイズに応じた最適な近似処理が可能となる。
そして、ステップS1004〜S1006において、粗輪郭データを直線と曲線により表現されるアウトラインデータへと変換する。具体的には、曲線は図14に示す(a)の三次ベジェ曲線と図14に示す(b)の二次ベジェ曲線を使用する。図14に示す(c)は直線を示す。
尚、図14に示す(a)の三次ベジェ曲線、図14に示す(b)の二次ベジェ曲線は、以下の式1、式2により表現される。
B(t)=(1-t)3・Q1+3(1-t)2・t・Q2+3(1-t)・t2・Q3+t3・Q4 …式1
B(t)=(1-t)2・Q1'+2(1-t)・t・Q2'+t2・Q3' …式2
図14において、点Q1,Q4,Q1’,Q3’,Q1”,Q2”をアンカーポイントとし、曲線を制御しているQ2,Q3,Q2’をコントロールポイントと呼ぶ。ここで、コントロールポイントとアンカーポイントを結ぶ直線、例えば直線Q1Q2は、アンカーポイントQ1において曲線と接する。
また、アンカーポイント間にコントロールポイントがなければ、図14に示す(c)のように直線となる。
[アンカーポイント抽出]
ステップS1003では、上述のステップS1002で抽出された接線線分上に新たな点を抽出し、それをアンカーポイントとする。アンカーポイントは、接線線分の端2つに対してそれぞれ抽出される。よって、一つの接線線分に対して2つのアンカーポイントが抽出されるが、2つのアンカーポイントが一致した場合には一つのアンカーポイントのみ抽出されるものとする。2つのアンカーポイントが抽出される場合は、アンカーポイントに挟まれた部位は自動的にオブジェクト上の直線となる。
ここで、接線線分上の一つの端点に対するアンカーポイントの抽出方法の一例について説明する。図15は、アンカーポイントの抽出方法の一例を示す図である。図15に示すV2を接線線分のベクトルとし、ベクトルV1側の端点に対するアンカーポイントの抽出方法について説明する。
まず、ベクトルV2に隣接するベクトルV1が接線線分であれば、その端点をアンカーポイントとする。隣接する線分が接線線分でない場合は、図15に示す(a)のように、ベクトルV2上端点よりa|V1|となる点をアンカーポイントとする。図15に示す(b)のように|V2|/2<a|V1|となる場合は、V2ベクトルの中心点をアンカーポイントとする。
[一次近似、二次近似]
次に、ステップS1004、S1005では、ステップS1003で抽出されたアンカーポイント間をベジェ関数で曲線近似する。尚、ステップS1003で自動的に直線属性となった線分に対しては曲線近似処理を行わない。
曲線近似処理は、具体的には2つの種類の近似処理からなる。まず、アンカーポイントの間が数個(<n1)の線分から構成されるようなオブジェクト上の細かい部位を纏めて一つの曲線で置き換える一次近似処理(ステップS1004)と、数個より多い線分から構成される線分に対して1つ或いは複数の曲線を用いて近似する二次近似処理(ステップS1005)とである。前者の手法は、線分の組み合わせに対して1つの曲線を当てはめる処理であるが、後者の手法を用いても数個の線分に対して近似を行うことも可能なため、後者の手法のみを用いてアンカーポイント間を曲線近似処理しても良い。しかしながら、前者の手法は、後者の手法に比べ、パフォーマンスの点で優れており、また少ない線分の組み合わせに対して確実に少ないポイント数で近似できるため、細かい部位については一次近似を用いることが望ましい。
まず、図16を参照して一次近似処理(ステップS1004)の一例について説明する。ここで図16に示す点A1、A2がそれぞれステップS1003で抽出されたアンカーポイントとする。そして、アンカーポイント間の線分L0,L1,L2に対して、C1,C2といったコントロールポイントを設けることで曲線を近似する。
尚、C1、C2の値はL0,L2との関係から求められる。また、アンカーポイント間が数個の線分により構成され、両端のアンカーポイントに対する接線成分が直交している場合は二次ベジェ曲線で置き換える。また、数個の線分がオブジェクトの大きさに対して十分大きければ、三次ベジェを用いてより精密に置き換えても良い。
ここで、一次近似処理はパターンに応じた置き換えであり、ステップS1003のアンカーポイントの抽出もパターンに応じた処理であるため、これら2つのステップをまとめて行っても良い。
次に、二次近似処理(ステップS1005)について説明する。まず、二次近似処理で使用する曲線を図17に示す。図17に示すように、曲線は三次ベジェ曲線であり、アンカーポイントP0,P3を結ぶ直線と、コントロールポイントP1,P2を結ぶ直線とは平行になるよう構成されている。このような平行制限を設けると、三次ベジェ曲線L0上の点で直線P0P3より最も離れた点Pfとの距離をDf、直線P0P3とコントロールポイントP1,P2との距離をDcとすると、次式の関係が成り立つ。
Dc=4/3Df …式3
尚、平行制限を用いたベジェ曲線を使用することで、近似処理を簡易に行うことが可能となる。
以下、近似処理の概要について説明する。二次近似処理では、まず区分曲線に分割し、各区分曲線に対して曲線近似処理を行う。ここで、区分曲線とは、図17に示すように、曲線が1つの弧を描く、即ち三次曲線において2つのアンカーポイントによる直線に対して2つのコントロールポイントが同方向に構成されているような曲線である。
区分曲線への分割では、まず図18に示す(b)のように、複数の線分の組み合わせにより、パターンマッチング的に方向ベクトルを抽出する。求められた方向ベクトルの変化を追っていき、方向ベクトル変化の正負が変化した点が分割点である。
尚、上述の分割点は、曲線近似におけるアンカーポイントとなり、アンカーポイントにおける接線ベクトルは、方向ベクトルがそのままなる。
また、図18に示す(a)は、区分曲線へ分割した例を示す図である。
次に、図19を参照して区分曲線に対する曲線近似処理について説明する。図19では、一つの区分曲線を示しており、区分曲線上の線分よりN個の点を抽出したものをそれぞれp1,p2,…,pNとする。このとき、区分曲線の始点p1、終点pNはアンカーポイントである。
尚、各アンカーポイントにおける接線線分は、ステップS1005もしくは区分曲線への分割におけるアンカーポイント抽出時にそれぞれ抽出されている。
ここで、アンカーポイントp1、pNを結ぶ線分p1pNより最も距離の離れている曲線上の点pfを求める。二次近似処理においては、関数近似処理を簡易に行うため、コントロールポイントを結ぶ線分C1C2が線分p1pNに対して平行となるように近似する。よって、点pfと線分p1pNとの距離をLとすると、点C1、C2より線分p1pNへの距離が(4/3)×Lとなるように、C1、C2を求める。
例えば、pfの座標値が(pfx,pfy)であった場合、p1、pNの各座標値(p1x,p1y)、(pNx,pNy)とp1における接線ベクトルp1C1(pcx,pcy)を用いると、C1の座標値(C1x,C1y)は、
C1x=K×pfx+p1x
C1y=K×pfy+p1y
K=(3p1x−4pfx)(pNy−p1y)+(pNx−p1x)(4pfy−3p1y)
+p1x(pNy−p1y)−p1y(pNx−p1x)
/(3(pNy−p1y)pcx+3(pNx−p1x)pcy)
となり、pfの座標値より一意に決定することができる。また、C2についても、C1と同様に求めることが可能である。
以上の区分曲線への曲線近似処理を全てのオブジェクト上全ての区分曲線へ行うことで、オブジェクトのアウトラインは直線とベジェ曲線により構成されるアウトラインデータへと変換される。
[補正処理]
以上、ステップS1001〜S1005により、オブジェクトの外形を直線及び曲線により構成されたアウトラインベクトルデータへ変換できるが、本手法では水平ベクトルと垂直ベクトルのみを使用した粗輪郭データから変換するため、また処理を効率化して行っているために、一連のステップで作成されたアウトラインベクトルデータは一種の癖をもつベクトルデータとなる。即ち、ステップS1006では、アウトラインベクトルデータを解析し、これらの癖を補正する処理を行う。
図20は、具体的にアウトラインベクトルデータの癖を表した図である。水平ベクトルと垂直ベクトルのみの粗輪郭データを用いて解析し、変換しているため、原図形における斜め直線は、曲線により表現されている。これらについては、アンカーポイント間を結ぶ直線とコントロールポイントとの距離を調べ、斜め直線か否かを判別する。ここで、斜め直線と判断された場合、アンカーポイント間のコントロールポイントを排除して斜め直線に置き換える。
[アプリデータへの変換処理]
以上の通り、1頁分のイメージデータを像域分離処理303し、ベクトル化処理304した結果は図21に示すような中間データ形式のファイルとして変換される。このようなデータ形式は、ドキュメント・アナリシス・アウトプット・フォーマット(DAOF)と呼ばれる。
図21は、DAOFのデータ構造を示す図である。図21において、2101はHeaderであり、処理対象の文書画像データに関する情報が保持される。2102はレイアウト記述データ部であり、文書画像データ中の文字(TEXT)、タイトル(TITLE)、キャプション(CAPTION)、線画(LINEART)、自然画(PICTURE)、枠(FRAME)、表(TABLE)等の属性毎に認識された各ブロックの属性情報とその矩形アドレス情報を保持する。2103は文字認識記述データ部であり、TEXT、TITLE、CAPTION等のTEXTブロックを文字認識して得られる文字認識結果を保持する。2104は表記述データ部であり、TABLEブロックの構造の詳細を格納する。2105は画像記述データ部であり、PICTUREやLINEART等のブロックのイメージデータを文書画像データから切り出して保持する。
このようなDAOFは中間データとしてのみならず、それ自体がファイル化されて保存される場合もあるが、このファイルの状態では、所謂一般の文書作成アプリケーションで個々のオブジェクトを再利用することはできない。
そこで、このDAOFからアプリケーションデータに変換する電子文書作成処理309について説明する。
図22は、電子文書作成処理の全体の概略を示すフローチャートである。まずステップS2201において、DAOFデータの入力を行う。次に、ステップS2202において、アプリデータの元となる文書構造ツリー生成を行う。そして、ステップS2203で、文書構造ツリーに基づいてDAOF内の実データを流し込み、実際のアプリデータを生成する。
図23は、文書構造ツリー生成処理の詳細を示すフローチャートである。また、図24は文書構造ツリーを説明するための図である。尚、全体制御の基本ルールとして、処理の流れはミクロブロック(単一ブロック)からマクロブロック(ブロックの集合体)へ移行する。尚、以下の説明で、「ブロック」はミクロブロック及びマクロブロック全体を指すものとする。
まず、ステップS2301では、ブロック単位に縦方向の関連性に基づいて再グループ化する。スタート直後はミクロブロック単位での判定となる。ここで、関連性とは、距離が近い、ブロック幅(横方向の場合は高さ)がほぼ同一であることなどで定義することができる。また、距離、幅、高さなどの情報はDAOFを参照し、抽出する。
図24は、ページの構成とその文書構造のツリーを示す図である。図24に示す(a)は実際のページ構成、図24に示す(b)はその文書構造ツリーである。
ステップS2301での結果、図24に示すT3、T4、T5が1つのグループV1として生成され、T6、T7が1つのグループV2として生成され、図24に示す(b)のように、グループV1とグループV2が同じ階層のグループとして生成される。そして、ステップS2302において、縦方向のセパレータの有無をチェックする。セパレータは、例えば物理的にはDAOF中でライン属性を持つオブジェクトである。また、論理的な意味としては、アプリ中で明示的にブロックを分割する要素である。ここでセパレータを検出した場合は、同じ階層で再分割する。
次に、ステップS2303において、分割がこれ以上存在し得ないか否かをグループ長を利用して判定する。ここで、縦方向のグループ長がページ高さとなっている場合、文書構造ツリー生成を終了する。また、図24に示す例の場合、セパレータもなく、グループ高さはページ高さではないのでステップS2304へ進み、ブロック単位で横方向の関連性に基づいて再グループ化する。ここもスタート直後の第一回目はミクロブロック単位で判定を行うことになる。尚、関連性、及びその判定情報の定義は、縦方向の場合と同じである。
図24に示す例の場合、T1、T2でH1が、V1、V2でH2がV1、V2の1つ上の同じ階層のグループとして生成される。そして、ステップS2305において、横方向セパレータの有無をチェックする。図24に示す例では、S1があるので、これをツリーに登録し、H1、S1、H2という階層を生成する。
次に、ステップS2306において、分割がこれ以上存在し得ないか否かをグループ長を利用して判定する。ここで、横方向のグループ長がページ幅となっている場合、文書構造ツリー生成を終了する。また、そうでない場合はステップS2301に戻り、再びもう一段上の階層で、縦方向の関連性チェックから繰り返す。図24に示す例の場合、分割幅がページ幅になっているので、ここで終了し、最後にページ全体を表す最上位階層のV0が文書構造ツリーに付加される。
文書構造ツリーが完成した後、その情報に基づいてアプリデータを生成する(ステップS2203)。図24に示す例の場合、具体的には、以下のようになる。
即ち、H1は横方向に2つのブロックT1及びT2があるので、2カラムとし、T1の内部情報(DAOFを参照、文字認識結果の文章、画像など)を出力後、カラムを変え、T2の内部情報出力、その後S1を出力する。次に、H2は横方向に2つのブロックV1及びV2があるので、2カラムとして出力、V1はT3、T4、T5の順にその内部情報を出力、その後カラムを変え、V2のT6、T7の内部情報を出力する。
以上の処理によりアプリデータへの変換処理を行うことができる。
次に、図面を参照しながら本発明に係る実施例2について詳細に説明する。尚、実施例1におけるベクトル化では、図10に示したように、ノイズ除去(ステップS1001)を行った後、接線線分を抽出する(ステップS1002)というステップを踏んでいる。しかし、図11に示す(a)、(b)のようなノイズの判断における解析(マッチング)処理が重たいという問題がある。また、実施例1では単純なパターンにおけるノイズ除去のみを取り扱ったが、より高画質なアウトラインを生成するためにはノイズを綺麗に除去する必要があり、ノイズ除去は非常に重要な処理である。
そこで、より詳細にノイズを解析しようとした場合、より処理が重くなり、問題を深刻化させる。しかし、本手法で取り扱うノイズは一画素大の凹凸ノイズであり、それらは水平成分及び垂直成分に対するノイズと判断できる。また、図11に示す(a)、(b)のようなノイズは、水平方向及び垂直方向におけるノイズである。
よって、図11に示す(a)、(b)のようなノイズを無視し、垂直方向及び水平方向の線分とみなしてしまう、線分とみなした状態で、接線線分を抽出し、接線線分上にノイズが存在した場合のみ、そのノイズを解析し、ノイズ除去を行う、という手法をとる。
以上の処理を行った場合は接線線分上でないノイズについてはより詳細に解析する必要もなく、また、特別除去する必要もない。
図25は、実施例2における粗輪郭データをアウトラインベクトルデータへと変換する処理を示すフローチャートである。
まず、ステップS2501において、粗輪郭データを抽出し、その粗輪郭データに対し、接線線分抽出処理を行う。この際、除去すべきノイズであるか、ノイズでないのかわからない粗輪郭上の凹凸については、それらを垂直線分、水平線分として粗輪郭上の線分として扱う。そして、ステップS3502において、接線線分抽出後、接線線分上のノイズのみより詳細にノイズを検証し、ノイズを除去する。
これ以降のステップS2503〜S2506での処理は、実施例1で説明した図10に示したステップS1003〜S1006での処理と同様に、アンカーポイントを抽出し、アンカーポイント間を曲線近似処理する。
以上の処理により無駄なノイズ解析を省き、高速に処理することが可能である。
次に、図面を参照しながら本発明に係る実施例3について詳細に説明する。尚、実施例1では、接線線分抽出において、各抽出条件に対して抽出される接線線分を同等に扱ったが、各条件により抽出される接線線分に優先順位をつけて扱っても良い。
ここでいう「優先順位」とは、優先順位が高い線分ほどオブジェクトの形状をより良く表す接線線分であることを意味し、優先順位が高い線分を低い線分よりも重要に扱うことを目的とする。
例えば、実施例1で説明した条件(1)〜(4)によって抽出される接線線分について、(1)が最も優先順位が高い条件とし、数字が上がるにつれ、優先順位を下げ、(4)が最も優先順位が低い条件とする。
図10に示したステップS1003において、アンカーポイントの抽出を行うが、優先順位の低い線分については、接線線分上の線分を残さないようにアンカーポイントを抽出する。例えば、図26に示す(a)のように、線分が構成され、V2が接線線分とする。このとき、接線線分V2が優先順位の高い線分であれば、先に述べた手法によって図26に示す(b)のようにアンカーポイントを抽出する。ここで、抽出された接線線分が優先順位の低い線分であれば、図26に示す(c)のように、元の線分を残さないでアンカーポイントを抽出する。
尚、図26に示す(C)のアンカーポイントA3の位置は、V1とV3の線分の大きさの比率から求めたものである。
次に、ステップS1004において、アンカーポイント間をベジェ曲線による一次近似を行うが、優先順位が高いものと低いものから抽出されたアンカーポイントかによって、構成する曲線を変える。ここで、優先順位の高い接線線分により抽出されたアンカーポイントを優先順位の高いアンカーポイントとし、優先順位の低い接線線分より抽出されたアンカーポイントを優先順位の低いアンカーポイントとする。
例えば、両端が優先順位の高いアンカーポイントであれば、図27に示す(a)のように、三次のベジェ曲線によって近似する。また、一方が優先順位の高いアンカーポイントであり、もう一方が優先順位の低いアンカーポイントであれば、二次ベジェ曲線によって図27に示す(b)のように近似する。更に、両端が優先順位の低いアンカーポイントであれば、図27に示す(c)のように直線で近似してしまう。
尚、ベジェ近似では、ポイント間を構成するV1,V2,V1’,V2’の線分長の比率よりコントロールポイント位置を決定している。
以上のように、輪郭線から得られる接線線分の推定という解析をより詳細に行い、その結果に対して各処理を変化させることにより、画質を保ったまま、無駄な部分についてはポイント数を減らすことが可能となる。
次に、図面を参照しながら本発明に係る実施例4について詳細に説明する。実施例1では、二次近似処理として、区分曲線上の一点を用いることで近似する簡易な関数近時処理について説明した。しかし、実施例1の簡易な手法では、区分曲線への曲線分割の精度によって区分曲線の点列に対し、近似した曲線が極端に離れることもある。そのような場合、関数近似が良好に行われているか否かを判定し、元の曲線に対して誤差が大きければ、再関数近似化することで関数近似処理の精度を向上させることも可能である。
尚、判定手法も簡易な手法である必要があるが、その判定手法について説明する。
図28は、実施例4における曲線分割の精度判定を説明するための図である。図28に示すように、点線で表す区分曲線の点列Ldに対して特徴点Pdを用いて関数近似化すると、曲線L0’が求まる。ここで、曲線L0’上の点Pfと特徴点Pdとの距離が一致していれば、曲線近似は良好に行われていることを示し、PdとPfとの距離が大きければ、近似は失敗し、本来の曲線を描いていない可能性が高いことを示す。
ここで、曲線近似が失敗した場合、例えば点Pdと点Pfとの距離が一定値以上の場合は、点Plを新たなアンカーポイントとし、P0〜PdとPd〜P3の2つの区分曲線に分割し、それぞれの区分曲線に対して上述した関数近似処理を行う。このような失敗した場合の分割処理は、繰り返し行うことも可能であり、閾値の設定次第では精密に曲線近似処理を行うことができる。
以上説明した実施例によれば、2値画像データより垂直ベクトル及び水平ベクトルのみからなる粗輪郭線を抽出し、その粗輪郭線を用いて曲線を解析することで、処理の高速化と高画質なアウトライン作成が可能となる。具体的には、粗輪郭線より原稿オブジェクトの0°/90°の接線を推定し、推定された接線間を曲線近似する。
尚、曲線近似は細かい部分に適用する第1の近似と、残りの大きな弧を描く曲線部分に対して近似する第2の近似の2つの近似処理からなる。
また、処理が重くなるという第一の課題に対しては、
本実施例では、ラスター画像より得られる粗輪郭データをそのまま使用しており、扱うデータは水平ベクトルと垂直ベクトルである。解析はノイズ判別、特徴量抽出、局所的な曲線近似の工程を含み、解析手法としてパターンマッチングを採用し、水平ベクトル及び垂直ベクトルのみに対するパターンマッチングは非常に効率良く行うことが可能となる。即ち、直線近似処理という繰り返し演算、複雑な処理を必要としない、また解析に際し、一旦ショートベクトルに変換する必要がないという点で、パフォーマンスの点においても非常に有効である。
また、曲線近似処理では、平行制限を加えたベジェ曲線を使用して入るため、アンカーポイント間より特徴点を一点抽出することで一意に曲線が決定できる。
尚、その特徴点は、曲線上のアンカーポイント間より最も離れた点として抽出しているため、誤差を求めて最適化するような繰り返し演算は必要としない。
よって、この点においても、パフォーマンスの点で非常に有効である。
以上、本実施例では、粗輪郭へのパターンマッチングを用いた解析、局所的な曲線近似、かつ平行制限を用いた曲線近似処理と、一連の処理において従来手法に比して、大幅にパフォーマンスを向上させることが可能となる。
一方、簡易な手法では画質が劣化するという課題2に対しては、
本実施例では、一つの輪郭線について、アウトラインベクトル化する際、画質の劣化が目立つようなオブジェクト上の細かく変化する部位について、第1の近似処理でパターンマッチングによる曲線近似を行う。尚、細かな部位に対するパターンマッチングでは接線線分等の解析結果に応じて変更しているため、少ないデータ量で表現された綺麗な曲線を得ることが可能である。
また、本実施例は粗輪郭データをそのまま扱う簡易な手法であるため、場合によっては少々癖も出てくる。それらのパターン化されている癖については、最後に補正処理を行うことで、修正する。尚、補正処理では、既に直線と曲線によって構成されたアウトラインデータ(データ量が大幅に減少しているデータ)に対して行うため、特別パフォーマンスへ影響を与えるような処理ではない。
最後に、オブジェクトの大きさに対する点については、
本実施例では、ノイズ、形状解析および局所的な近似にパターンマッチングを使用しており、オブジェクトの大きさ及び輪郭線の大きさに応じてパターンマッチングを変更しているため、細かなオブジェクトから大きなオブジェクトまで柔軟に対応することが可能となる。ここでパターンマッチングで変更するパラメータは、粗輪郭線分の長さであるため、各パターンマッチングに対し、パラメータを柔軟に変更することが可能であり、小さなオブジェクト及び輪郭線から、大きなオブジェクト及び輪郭線に対し、柔軟に対応することが可能となる。
尚、本発明は複数の機器(例えば、ホストコンピュータ,インターフェース機器,リーダ,プリンタなど)から構成されるシステムに適用しても、1つの機器からなる装置(例えば、複写機,ファクシミリ装置など)に適用しても良い。具体的には、複合機や、複写機や、ファクシミリ装置で、高品位に変倍するために、スキャンした画像データを入力し(公衆回線やネットワークから画像データを入力しても良い)、画像データから輪郭ベクトルを抽出し、抽出した輪郭ベクトルを変倍し、変倍された輪郭ベクトルから画像データを生成し、生成した画像データをプリントする際の輪郭ベクトル抽出時に適用できる。
また、本発明の目的は前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記録媒体を、システム或いは装置に供給し、そのシステム或いは装置のコンピュータ(CPU若しくはMPU)が記録媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。
この場合、記録媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記録媒体は本発明を構成することになる。
このプログラムコードを供給するための記録媒体としては、例えばフロッピー(登録商標)ディスク,ハードディスク,光ディスク,光磁気ディスク,CD−ROM,CD−R,磁気テープ,不揮発性のメモリカード,ROMなどを用いることができる。
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部又は全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
更に、記録媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部又は全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
実施例1における文書処理装置の概観を示す図である。 実施例1における文書処理装置の構成を示すブロック図である。 文書処理装置における文書の電子化処理の概要を示す図である。 像域分離処理を説明するための図である。 像域分離処理303で分離された各ブロックに対するブロック情報と入力ファイル情報を示す図である。 アウトライン作成部306、307の処理を示すフローチャートである。 粗輪郭データ及びアウトラインベクトルデータの一例を示す図である。 ラスター画像データの1画素を示す図である。 粗輪郭データの構成の一例を示す図である。 実施例1における粗輪郭データをアウトラインベクトルデータへと変換する処理を示すフローチャートである。 除去するノイズの一例を示す図である。 ノイズに似た粗輪郭データの一例を示す図である。 粗輪郭データより接線線分の抽出を説明するための図である。 粗輪郭データをアウトラインデータへと変換する際に使用される三次ベジェ曲線、二次ベジェ曲線、直線を示す図である。 アンカーポイントの抽出方法の一例を示す図である。 一次近似処理の一例を説明するための図である。 二次近似処理で使用する曲線を示す図である。 区分曲線へ分割した例とパターンマッチング的に方向ベクトルを抽出する例を示す図である。 区分曲線に対する曲線近似処理を説明するための図である。 具体的にアウトラインベクトルデータの癖を表した図である。 ドキュメント・アナリシス・アウトプット・フォーマット(DAOF)のデータ構造を示す図である。 電子文書作成処理の全体の概略を示すフローチャートである。 文書構造ツリー生成処理の詳細を示すフローチャートである。 ページの構成とその文書構造のツリーを示す図である。 実施例2における粗輪郭データをアウトラインベクトルデータへと変換する処理を示すフローチャートである。 実施例3におけるアンカーポイントの抽出を説明するための図である。 実施例3における曲線近似を説明するための図である。 実施例4における曲線分割の精度判定を説明するための図である。

Claims (13)

  1. 入力手段が、画像データを入力する入力工程と、
    2値化手段が、入力された画像データを2値化する2値化工程と、
    輪郭抽出手段が、2値化された画像データから画像の輪郭を抽出する輪郭抽出工程と、
    接点推定手段が、抽出された輪郭より接線を抽出し、抽出された接線より接点を推定する接点推定工程と、
    関数近似手段が、推定された接点に対して隣接する接点間の輪郭を所定の関数で近似する関数近似工程とを有し、
    前記接点推定工程では、水平及び垂直方向の直線パターンをパターンマッチングによって検出し、検出された直線パターンと近傍の輪郭画素との相対位置関係によって接点を推定することを特徴とする関数化処理方法。
  2. 前記輪郭抽出工程では、前記画像の1画素を4点からなる正方形として扱い、該正方形の周囲を追跡するように輪郭線を抽出することで、垂直及び水平ベクトルからなる前記画像の輪郭を抽出することを特徴とする請求項1記載の関数化処理方法。
  3. 入力手段が、画像データを入力する入力工程と、
    2値化手段が、入力された画像データを2値化する2値化工程と、
    輪郭抽出手段が、2値化された画像データから画像の輪郭を抽出する輪郭抽出工程と、
    接点推定手段が、抽出された輪郭より接線を抽出し、抽出された接線より接点を推定する接点推定工程と、
    関数近似手段が、推定された接点に対して隣接する接点間の輪郭を所定の関数で近似する関数近似工程とを有し、
    前記関数近似工程は、
    前記接点間の輪郭線分数が予め定めた閾値よりも小さい接点間の輪郭線分群に対して、接点間の相対位置関係により接点間を一つの二次ベジェ曲線、一つの三次ベジェ曲線、或いは直線をあてはめる第1の近似処理と、
    前記接点間の輪郭線分数が予め定めた閾値よりも小さくない接点間の輪郭線分群に対して、一つ或いは複数の三次ベジェ曲線により曲線をあてはめる第2の近似処理とを有することを特徴とする関数化処理方法。
  4. 前記第1の近似処理は、前記接点推定工程における水平及び垂直方向の直線パターンのパターン推定結果に応じて、二次ベジェ曲線、三次ベジェ曲線、或いは直線の何れか1つをあてはめて近似することを特徴とする請求項記載の関数化処理方法。
  5. 前記第2の近似処理は、輪郭線分群に対して1つ或いは複数の三次ベジェ曲線をあてはめる処理で、該三次ベジェ曲線はアンカーポイント間を結ぶ直線とコントロールポイント間を結ぶ直線とが平行であることを特徴とする請求項記載の関数化処理方法。
  6. 入力手段が、画像データを入力する入力工程と、
    2値化手段が、入力された画像データを2値化する2値化工程と、
    輪郭抽出手段が、2値化された画像データから画像の輪郭を抽出する輪郭抽出工程と、
    接点推定手段が、抽出された輪郭より接線を抽出し、抽出された接線より接点を推定する接点推定工程と、
    関数近似手段が、推定された接点に対して隣接する接点間の輪郭を所定の関数で近似する関数近似工程とを有し、
    前記関数近似工程は、
    前記接点間の輪郭線分数が予め定めた閾値よりも小さい接点間の輪郭線分群に対して、接点間の相対位置関係により近似処理を行うことを特徴とする関数化処理方法。
  7. 画像データを入力する入力手段と、
    入力された画像データを2値化する2値化手段と、
    2値化された画像データから画像の輪郭を抽出する輪郭抽出手段と、
    抽出された輪郭より接線を抽出し、抽出された接線より接点を推定する接点推定手段と、
    推定された接点に対して隣接する接点間の輪郭を所定の関数で近似する関数近似手段とを有し、
    前記接点推定手段は、水平及び垂直方向の直線パターンをパターンマッチングによって検出し、検出された直線パターンと近傍の輪郭画素との相対位置関係によって接点を推定することを特徴とする関数化処理装置。
  8. 前記輪郭抽出手段は、前記画像の1画素を4点からなる正方形として扱い、該正方形の周囲を追跡するように輪郭線を抽出することで、垂直及び水平ベクトルからなる前記画像の輪郭を抽出することを特徴とする請求項7記載の関数化処理装置。
  9. 画像データを入力する入力手段と、
    入力された画像データを2値化する2値化手段と、
    2値化された画像データから画像の輪郭を抽出する輪郭抽出手段と、
    抽出された輪郭より接線を抽出し、抽出された接線より接点を推定する接点推定手段と、
    推定された接点に対して隣接する接点間の輪郭を所定の関数で近似する関数近似手段とを有し、
    前記関数近似手段は、
    前記接点間の輪郭線分数が予め定めた閾値よりも小さい接点間の輪郭線分群に対して、接点間の相対位置関係により接点間を一つの二次ベジェ曲線、一つの三次ベジェ曲線、或いは直線をあてはめる第1の近似処理と、
    前記接点間の輪郭線分数が予め定めた閾値よりも小さくない接点間の輪郭線分群に対して、一つ或いは複数の三次ベジェ曲線により曲線をあてはめる第2の近似処理とを有することを特徴とする関数化処理装置。
  10. 前記第1の近似処理は、前記接点推定手段における水平及び垂直方向の直線パターンのパターン推定結果に応じて、二次ベジェ曲線、三次ベジェ曲線、或いは直線の何れか1つをあてはめて近似することを特徴とする請求項9記載の関数化処理装置。
  11. 前記第2の近似処理は、輪郭線分群に対して1つ或いは複数の三次ベジェ曲線をあてはめる処理で、該三次ベジェ曲線はアンカーポイント間を結ぶ直線とコントロールポイント間を結ぶ直線とが平行であることを特徴とする請求項9記載の関数化処理装置。
  12. 画像データを入力する入力手段と、
    入力された画像データを2値化する2値化手段と、
    2値化された画像データから画像の輪郭を抽出する輪郭抽出手段と、
    抽出された輪郭より接線を抽出し、抽出された接線より接点を推定する接点推定手段と、
    推定された接点に対して隣接する接点間の輪郭を所定の関数で近似する関数近似手段とを有し、
    前記関数近似手段は、
    前記接点間の輪郭線分数が予め定めた閾値よりも小さい接点間の輪郭線分群に対して、接点間の相対位置関係により近似処理を行うことを特徴とする関数化処理装置。
  13. 請求項1乃至6の何れか1項記載の関数化処理方法の各手順をコンピュータに実行させるためのプログラム。
JP2004161571A 2004-04-26 2004-05-31 関数化処理方法及び関数化処理装置 Expired - Fee Related JP4371911B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004161571A JP4371911B2 (ja) 2004-05-31 2004-05-31 関数化処理方法及び関数化処理装置
US11/109,851 US7873218B2 (en) 2004-04-26 2005-04-20 Function approximation processing method and image processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004161571A JP4371911B2 (ja) 2004-05-31 2004-05-31 関数化処理方法及び関数化処理装置

Publications (3)

Publication Number Publication Date
JP2005346137A JP2005346137A (ja) 2005-12-15
JP2005346137A5 JP2005346137A5 (ja) 2007-07-19
JP4371911B2 true JP4371911B2 (ja) 2009-11-25

Family

ID=35498495

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004161571A Expired - Fee Related JP4371911B2 (ja) 2004-04-26 2004-05-31 関数化処理方法及び関数化処理装置

Country Status (1)

Country Link
JP (1) JP4371911B2 (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7889938B2 (en) 2006-03-31 2011-02-15 Canon Kabushiki Kaisha Method and apparatus for processing line drawings in images
JP4764231B2 (ja) 2006-03-31 2011-08-31 キヤノン株式会社 画像処理装置、制御方法、コンピュータプログラム
JP5058575B2 (ja) 2006-12-12 2012-10-24 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
JP5028174B2 (ja) * 2007-07-19 2012-09-19 キヤノン株式会社 画像処理装置、画像処理方法、及び、画像処理プログラム
JP5017031B2 (ja) * 2007-09-13 2012-09-05 キヤノン株式会社 画像処理装置、画像処理方法、画像処理プログラム、並びに、記憶媒体
JP4933404B2 (ja) 2007-11-07 2012-05-16 キヤノン株式会社 画像処理装置、画像処理方法、画像処理プログラム、並びに、プログラム記録媒体
JP5137679B2 (ja) * 2008-05-07 2013-02-06 キヤノン株式会社 画像処理装置および画像処理方法
JP4582200B2 (ja) 2008-06-03 2010-11-17 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、画像変換方法、およびコンピュータプログラム
JP5111242B2 (ja) 2008-06-04 2013-01-09 キヤノン株式会社 画像処理装置及び方法
JP4582204B2 (ja) 2008-06-11 2010-11-17 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、画像変換方法、およびコンピュータプログラム
JP5121599B2 (ja) 2008-06-30 2013-01-16 キヤノン株式会社 画像処理装置、画像処理方法およびそのプログラムならびに記憶媒体
JP5049920B2 (ja) 2008-08-26 2012-10-17 キヤノン株式会社 画像処理装置及び画像処理方法
JP4600552B2 (ja) 2008-09-16 2010-12-15 コニカミノルタビジネステクノロジーズ株式会社 アウトライン化方法およびそれを用いた画像圧縮方法、アウトライン化装置、ならびにアウトライン化プログラム
JP5328510B2 (ja) 2009-06-24 2013-10-30 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
JP5361574B2 (ja) * 2009-07-01 2013-12-04 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
JP5465015B2 (ja) 2010-01-06 2014-04-09 キヤノン株式会社 文書を電子化する装置及び方法
JP5653141B2 (ja) * 2010-09-01 2015-01-14 キヤノン株式会社 画像処理方法、画像処理装置、及び、プログラム
RU2469400C1 (ru) * 2011-11-17 2012-12-10 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ преобразования растрового изображения в метафайл
JP7235105B2 (ja) * 2019-05-08 2023-03-08 日本電信電話株式会社 点群解析装置、推定装置、点群解析方法、およびプログラム
WO2020225890A1 (ja) * 2019-05-08 2020-11-12 日本電信電話株式会社 点群解析装置、方法、およびプログラム

Also Published As

Publication number Publication date
JP2005346137A (ja) 2005-12-15

Similar Documents

Publication Publication Date Title
JP4371911B2 (ja) 関数化処理方法及び関数化処理装置
US7873218B2 (en) Function approximation processing method and image processing method
US6993185B2 (en) Method of texture-based color document segmentation
JP4646797B2 (ja) 画像処理装置及びその制御方法、プログラム
US8200012B2 (en) Image determination apparatus, image search apparatus and computer readable recording medium storing an image search program
CN105528614B (zh) 一种漫画图像版面的识别方法和自动识别系统
CN108146093B (zh) 一种去除票据印章的方法
JP5361574B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP4267475B2 (ja) 図面照合装置
JP2006253892A (ja) 画像処理方法及び画像処理装置
JP3950777B2 (ja) 画像処理方法、画像処理装置および画像処理プログラム
JP5137759B2 (ja) 画像処理装置
US8300946B2 (en) Image processing apparatus, image processing method, and computer program
JP2002190957A (ja) 文書処理装置及び方法
JPH11345339A (ja) 画像セグメンテ―ション方法及び装置及びシステム及びコンピュ―タ可読メモリ
JP5049922B2 (ja) 画像処理装置及び画像処理方法
JP4391704B2 (ja) 多値画像から二値画像を生成する画像処理装置および方法
JP2011248702A (ja) 画像処理装置、画像処理方法、画像処理プログラム及びプログラム記憶媒体
JP5335581B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP4049560B2 (ja) 網点除去方法及びシステム
JP2006345314A (ja) 画像処理装置および画像処理方法
Strouthopoulos et al. Identification of text-only areas in mixed-type documents
Roy et al. Multi-oriented English text line extraction using background and foreground information
JP5159588B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP2006106971A (ja) 表ベクトルデータ生成方法及び文書処理装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070531

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070531

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20070531

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090518

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090525

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090724

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090831

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090901

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120911

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4371911

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120911

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130911

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees