JP4991590B2 - 画像処理装置、画像処理方法、画像処理プログラム、及び、記憶媒体 - Google Patents

画像処理装置、画像処理方法、画像処理プログラム、及び、記憶媒体 Download PDF

Info

Publication number
JP4991590B2
JP4991590B2 JP2008033625A JP2008033625A JP4991590B2 JP 4991590 B2 JP4991590 B2 JP 4991590B2 JP 2008033625 A JP2008033625 A JP 2008033625A JP 2008033625 A JP2008033625 A JP 2008033625A JP 4991590 B2 JP4991590 B2 JP 4991590B2
Authority
JP
Japan
Prior art keywords
point
region
distortion
vectorized
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008033625A
Other languages
English (en)
Other versions
JP2009193361A (ja
Inventor
裕樹 岸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2008033625A priority Critical patent/JP4991590B2/ja
Priority to US12/369,357 priority patent/US8238686B2/en
Publication of JP2009193361A publication Critical patent/JP2009193361A/ja
Application granted granted Critical
Publication of JP4991590B2 publication Critical patent/JP4991590B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/182Extraction of features or characteristics of the image by coding the contour of the pattern
    • G06V30/1823Extraction of features or characteristics of the image by coding the contour of the pattern using vector-coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/287Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters

Description

本発明は、スキャナ等で入力された文書におけるオブジェクトのベクトル化における歪みを低減する画像処理装置に関する。
従来、画像のベクトル化については、ワードプロセッサ等で用いられるフォント(文字書体)を対象としたベクトル化技術が広く知られている。フォント(文字書体)を対象としたベクトル化の技術は、予め美しくデザインされた文字のみを入力対象としている。ベクトル化の際には、アナログ的に作成された1文字を512×512画素や1024×1024画素等の比較的大きなサイズの2値画像としてデジタイズし、輪郭をベクトル化している。
ベクトル化されたデータは、基本的には、各種の所望のサイズに拡大してもスムーズな輪郭表現が可能なことから、一般的に、形状の品質が良いとされている。更に、各種のサイズの文字を、1つのデータに基づいて生成可能であるので、簡便であり、また、データ量を削減することができるという利点がある。そのため、特許文献1のように、フォント(文字書体)のみならず、一般的な2値画像に対しても、それらの特徴を生かした効果を目的とし、ベクトル処理を施す技術が提案されている。また、ベクトル化されたデータは、基本的には座標値を基本とした数値データであるので、コンピュータでの編集処理等も容易である。そのため、特許文献2のように、フルカラーの部分を含む読み取り画像に対するベクトル化に関する提案もされている。
なお、特許文献1の前提となる2値画像のベクトル化に関しては、特許文献3においても開示されている。特許文献3においては、画像データにおける注目画素と、その近傍画素の状態を保持し、この注目画素をラスタ走査順に取り出し、その注目画素とその近傍画素の状態に基づいて、水平方向及び垂直方向の画素間ベクトルを検出する構成が開示されている。更には、これら画素間ベクトル同士の接続状態を判別し、判別された画素間ベクトルの接続状態をもとに、画像データの輪郭を抽出する手法が提案されている。その手法によって、画像中の全ての輪郭線を1回のラスタ走査順だけで抽出でき、かつ、全画像データを記憶するための画像メモリを必要としないので、メモリの容量を低減することができるとされている。また、入力画像の画素の中心位置ではなく、画素の縁単位に輪郭を抽出することにより、1画素幅の細線に対しても有為な幅を有する輪郭線を抽出することができるとされている。
また、文字にベクトル化技術を適用した際に、ベクトル化の近似精度が悪く、ベクトル化対象の文字とベクトル化された文字との間で輪郭が一致せず、その結果、ベクトル化において特有の歪みが発生する場合が多い。そのような課題について、特許文献4においては、輪郭ベクトルの所定数の端点の位置を一度に調整しながら、与えられた輪郭点と輪郭ベクトルとの距離関数を求め、ノルムが最小となる輪郭ベクトルを得る方法が開示されている。しかしながら、処理時間を低減することについては特に記載されていないので、製品の実装に適用することは難しい。
特許3049672号公報(段落[0078]) 特許2845107号公報(段落[0004]、[0005]) 特許3026592号公報(第14頁) 特開平05−35871号公報(段落[0018])
そこで、上記の点に鑑み、本発明は、ベクトル化されたオブジェクトに発生する歪を低減する処理において、処理時間の増大を抑止することができる画像処理装置を提供する。
上記課題を解決するため、本発明に係る画像処理装置は、画像に含まれるオブジェクトをベクトル化し出力する画像処理装置であって、前記オブジェクトの輪郭線上において、(i)凸に屈曲した屈曲点を有する凸部領域と、(ii)凹に屈曲した屈曲点を有する凹部領域と、(iii)相隣接する屈曲点の間で予め定められた曲率より大きい曲率を有する曲線領域と、を歪みの発生しやすい評価対象領域として特定し、当該特定した評価対象領域において、前記オブジェクトと該オブジェクトをベクトル化したベクトル化オブジェクトとのそれぞれの形状を比較して、前記オブジェクトのベクトル化において発生した歪みの大きさを示す歪量を各評価対象領域について算出する算出手段と、前記歪量と予め定められた基準値とを比較し、前記歪量が前記基準値よりも大きいと判断された評価対象領域における前記ベクトル化オブジェクトの形状を前記オブジェクトの形状に近づけて前記歪量を低減するように修正する修正手段と、を備え、前記修正手段は、(i)前記歪量が前記基準値よりも大きいと判断された前記ベクトル化オブジェクトの前記凸部領域において、前記オブジェクトの前記凸に屈曲した屈曲点に対応する点にアンカーポイントを設定し、(ii)前記歪量が前記基準値よりも大きいと判断された前記ベクトル化オブジェクトの前記凹部領域において、前記オブジェクトの前記凹に屈曲した屈曲点に対応する点にアンカーポイントを設定し、(iii)前記歪量が前記基準値よりも大きいと判断された前記ベクトル化オブジェクトの前記曲線領域において、前記オブジェクトの前記曲線領域に対応する点にコントロールポイントを移動させる、ことによって前記ベクトル化オブジェクトの形状を修正し、前記修正手段は、前記歪量が前記基準値よりも大きいと判断された前記ベクトル化オブジェクトの相隣接する2つの前記凸部領域について前記ベクトル化オブジェクトの形状を修正する場合に、当該2つの前記凸部領域について輪郭線上に並ぶ4つのアンカーポイントのうち、中2つのアンカーポイントを結ぶ第1の線分が端2つのアンカーポイントそれぞれから延びる第2の線分と直交するならば、前記第1の線分と前記第2の線分それぞれとが交わる点にアンカーポイントを設定して、前記4つのアンカーポイントを消去する、ことを特徴とする。
本発明によれば、ベクトル化されたオブジェクトに発生する歪を低減する処理において、処理時間の増大を抑止することができる。
以下に、本発明を実施するための最良の形態について、図面を参照しながら詳しく説明する。なお、同一の構成要素には同一の参照番号を付して、説明を省略する。
図1は、本発明に係る実施形態における画像処理装置のブロック構成を示す図である。図1に示すように、本画像処理装置は、スキャン部101、スキャンデータファイル化部102、ハードディスク103、出力ファイル生成部104、出力部105を含んでいる。本実施形態において、画像処理装置として、例えば、複数の機能が搭載されたMFP(MultiFunction Peripheral:多機能周辺装置)が用いられても良い。図2は、スキャンデータファイル化部102の機能構成を示すブロック図である。図2に示すように、スキャンデータファイル化部102は、ブロックセレクション部201、JPEG圧縮部202、ベクトル化部203、統合部204、メモリ205、歪低減部206、CPU207、出力部208を含んでいる。
ここで、本画像処理装置には、コピー機能と、スキャンデータをファイル化して内部のハードディスクに蓄積又はPCに送信するセンド機能が搭載されている。本画像処理装置は、コピー時においては、600dpiでスキャンが行われる。一方、センド時においては、600dpi又は300dpiのいずれかがユーザにより選択され、スキャンが行われる。ここで、本実施形態においては、センド機能が関係するので、以下、センド機能に限定して説明する。また、600dpi又は300dpiのいずれのスキャンデータでも適用される処理は同じであるので、以下、300dpiでスキャンする場合について説明する。
まず、ユーザから300dpiでスキャン指示を受けると、画像処理装置はスキャンデータファイル化部102にスキャンデータを送信する。スキャンデータファイル化部102は、スキャンデータに対してベクトル化などの様々な画像処理を加え、PDF等のファイルフォーマットとしてデータを纏め、ハードディスク103に出力する。本実施形態において、ハードディスク103は、本画像処理装置の内部のハードディスクとしているが、ネットワーク上に接続されているPCやその他の記憶媒体であっても良い。
図3は、スキャンデータファイル化部102の処理の手順を示すフローチャートである。以下、図2及び図3を参照しながら、スキャンデータファイル化部102の処理の手順について説明する。まず、ステップS301において、ブロックセレクション部201は、外部から入力された文書画像(入力画像)を文字、背景、写真、線画の4種類の領域に分割する。以下、分割された文字、背景、写真、線画を、オブジェクトともいう。領域分割されたオブジェクトは、メモリ205に格納されるようにしても良い。次に、ステップS302において、文字領域をベクトル化部203に送信し、入力画像をJPEG圧縮部202に送信する。JPEG圧縮部202は、入力画像中の文字領域を所定の色(例えば、各文字領域の周辺要素の色から求めた平均色)で塗りつぶした上で、JPEG圧縮を行い、圧縮された符号列をJPEGデータとしてメモリ205に送信する。なお、本実施形態では、文字領域を塗りつぶした入力画像全体をJPEG圧縮するものとしたが、文字領域(ベクトル化対象の領域)以外の領域毎にJPEG圧縮して保存するような形態にしても良い。また、本実施形態では、文字領域をベクトル化する例について説明するが、線画や表罫線などもベクトル化するように構成しても良い。ステップS303において、ベクトル化部203は、文字領域中の文字の輪郭を抽出してベクトル化を行い、ベクトル化された文字をベクトル化データとしてメモリ205に出力する。ベクトル化部203によるベクトル化の方法については、後述する。ステップS304において、CPU207は、入力された画像全体の処理が終了した時点で、残された処理時間に余裕があるか否かを判定する。ここで、余裕があると判定された場合には、ステップS305に進み、CPU207は歪低減部206に処理の実行を指示し、歪低減部206は、その指示により歪みを低減する処理を行う。歪低減部206の動作については、後述する。歪低減部206が処理を終了すると、ステップS306において、歪低減部206はメモリにデータを出力し、CPU207は、そのデータ出力を確認すると統合部204に統合処理を指示する。統合部204は、CPUからの指示を受けると、JPEGデータとベクトル化データとをPDF等のファイルフォーマットに統合して出力する。一方、ステップS304において、余裕がないと判定された場合には、歪低減処理を行わずにステップS306に進み、JPEGデータとベクトル化データとを統合するデータ統合処理が行われる。その場合には、歪低減処理が行われた場合に比べ、画質は低下する。また、ステップS304における判定は、例えば、CPU207が、残された処理時間を予め定められた基準時間と比較することによって行われても良い。
図4は、ベクトル化部203の機能構成を示すブロック図である。図4に示すように、ベクトル化部203は、粗輪郭抽出部401、アンカーポイント/コントロールポイント決定部402、アンカーポイント/コントロールポイント書き出し部403を含んでいる。以下、アンカーポイントを「AP」ともいい、コントロールポイントを「CP」ともいう。粗輪郭抽出部401は、入力された文字領域を2値化して粗輪郭を抽出し、メモリ205に出力する。ここで、粗輪郭とは、図6の四角部分に示すように、文字の輪郭を追跡したときに追跡方向が変わる点と点とを結んだ直線の集まりのことであり、ベクトル化部203からメモリ205には、点の情報のみが粗輪郭データとして出力される。アンカーポイント/コントロールポイント決定部402は、粗輪郭データに基づいて、APとCPとを決定する。更に、アンカーポイント/コントロールポイント書き出し部403は、決定されたアンカーポイントとコントロールポイントをメモリ205に出力する。次に歪低減部206の処理について説明する。
図5は、歪低減部206の機能構成を示すブロック図である。図5に示すように、歪低減部206は、文字データ取得部501、位置合わせ部502、評価対象領域特定部503、歪量測定部504、修正部505を含んでいる。次に、図5及び図7を参照しながら、歪低減部206の処理について説明する。
図7は、歪低減部206の処理の手順を示すフローチャートである。まず、ステップS701において、歪低減部206が、CPU207から処理の指示を受けると、文字データ取得部501が、リファレンス文字のラスタデータと評価対象文字のベクトルデータとをメモリ205から取得する。ここで、リファレンス文字とは、ベクトル化対象の文字画像をいい、図3におけるステップS303より前、例えばステップS301の結果、出力される文字を示す。また、評価対象文字とは、ベクトル化で得られる文字(ベクトル化オブジェクトともいう)をいい、図3におけるステップS303の結果、出力される文字を示す。次に、ステップS702において、歪みを測定する上で、図8に示すように、リファレンス文字と評価対象文字を重ね合わせることにより、輪郭のずれ量に着目し、位置合わせを行う。位置合わせの方法は一般的に知られており、例えば、まず、評価対象文字のベクトルデータがラスタライズされ、ラスタ画像が生成される。そして、「2つの画像間の画素値の差分和の算出」と、「一方の画像を他方に対して1画素移動」の2つの処理を繰り返し行い、差分和が最小となる位置関係が求められて、2つの画像の位置合わせを行う。ステップS703において、後述する評価対象領域が特定され、ステップS704において、評価対象領域における歪量が測定され、ステップS705において、歪みを低減して修正する歪低減化処理が行われる。以下、更に、ステップS703〜S705の処理について説明する。
ステップS703においては、視覚的に与える影響が大きく、ベクトル化において特に歪みが発生しやすい領域を特定する。本実施形態において、そのような歪みの発生しやすい領域を評価対象領域とする。図9は、評価対象領域を説明する図である。図9に示すように、丸印で囲まれた部分が評価対象領域とされる。本実施形態においては、凹部領域、凸部領域、曲線領域、直線型面領域、直線近似領域の5つの領域が特定される。特に、凹部領域、凸部領域、曲線領域、直線型面領域は、リファレンス文字上で特定される。凹部領域及び凸部領域は、図9の丸印で示すようにリファレンス文字中の凹部領域及び凸部領域が歪んでしまうと視覚的に与える影響が大きいので、評価対象領域として特定される。また、曲線領域及び直線型面領域は、図9の丸印で示すようにリファレンス文字中の曲線領域及び直線領域の太さが変化してしまうと視覚的に与える影響が大きいので、評価対象領域として特定される。以下、直線型面領域は直線形状をしていることから、第1の直線形状領域ともいう。また、図9の丸印で示すように、比較的長く、かつ、曲率が大きい曲線領域が直線近似されてしまうと視覚的に与える影響が大きいので、直線近似領域が、評価対象文字上で評価対象領域として特定される。以下、直線近似領域は、直線形状をしていることから、第2の直線形状領域ともいう。次に、図7に示すステップS703におけるそれぞれの領域の特定方法について説明する。以上の5種類の評価対象領域は、一つの文字内で重複していても良い。例えば、横方向に長い直線型面領域の端部が、凸部領域となる場合もある。
図10は、凹部領域、凸部領域、曲線領域を特定する処理の手順を示すフローチャートである。まず、ステップS1001において、リファレンス文字の輪郭上の画素列を追跡することにより得られた画素列から屈曲点を抽出する。図11は、屈曲点について説明する図である。屈曲点とは、図11に示すように、画素列の角度が予め定められた角度以上に屈曲した箇所をいい、後のステップにおいて、凹点又は凸点に分類される。屈曲点の抽出方法については、一般的に広く知られている。図11に示すように、例えば、リファレンス文字の輪郭上の各画素を追跡する中で、画素P0を着目する。着目された画素P0について、その前後にK画素分離れた点P1及びP2を設定し、線分P0−P1と線分P0−P2とが成す角度の余弦値Cが計算される。その余弦値Cが所定値(例えば、−0.65)以上である場合に、画素P0が屈曲点として抽出される。
次に、ステップS1002において、屈曲部と屈曲部間領域とを決定する。図12は、屈曲部と屈曲部間領域とについて説明する図である。屈曲部とは、図12に示すように、屈曲点とリファレンス文字輪郭上の屈曲点の近傍画素とを合わせた部分をいう。ここで、近傍画素とは、屈曲点から、リファレンス文字の外接矩形の縦方向と横方向の長さの内、短い長さの1/10の距離以内に存在する画素列をいう。本実施形態において、屈曲点が凸点に分類された屈曲部を凸部領域ともいう。また、屈曲点が凹点に分類された屈曲部を凹部領域ともいう。また、図12に示すように、リファレンス文字輪郭上の相隣接する2つの屈曲部により挟まれた領域を屈曲部間領域とし、後のステップにおいて、屈曲部間領域が曲線領域であるか否かが判定される。
ステップS1003において、屈曲点が凹点と凸点とに分類される。分類方法については、図13に示すように、屈曲点から見て輪郭追跡方向を逆方向とした場合に、外積が正であれば凸点と決定し、負であれば凹点と決定して分類する。次に、ステップS1004において、屈曲部間領域に基づいて曲線領域を特定する。曲線領域は、屈曲部間領域が予め定められた曲率より大きいか否かで判定される。本実施形態における曲率は、図14に示すように、屈曲点同士を結ぶ直線とリファレンス文字の輪郭との間の距離における最大距離と平均距離の差diffに注目し、次式(1)によって求められる。
diff=abs(maxdist−avedist) ・・・(1)
ここで、「maxdist」は、最大距離を示し、「avedist」は平均距離を示す。また、「abs」とは絶対値を取得する関数を示す。本実施形態においては、差diffが予め定められた基準値より大きい場合に、屈曲部間領域を曲線領域として特定する。 図15は、直線型面領域を特定する方法を説明する図である。ここでは、文字ではなく図形を用いているが、文字に適用されても良い。本実施形態において、リファレンス文字に対して線芯化処理(芯線化処理ともいう)を行い、線芯化された各芯線と輪郭までの距離がほぼ一定であると判断したリファレンス文字上の領域を直線型面領域として特定する。ここで、そのような特定は、リファレンス文字の縦方向、横方向、又は、斜め方向において同様に行われる。また、後の歪みの低減化処理のために、直線型面領域の太さ、即ち、上述の距離がメモリ205に記憶される。なお、線芯化処理(芯線化処理)とは、対になる輪郭線の真ん中を通る線を求める処理であり、公知の技術を用いることができる。
直線近似領域は、評価対象文字に対する図6で説明したような粗輪郭抽出で抽出された粗輪郭の直線部分であって、かつ、文字の外接矩形の縦方向と横方向の長さの内、短い方の長さの半分以上の長さを有する部分を直線近似領域として特定する。
ステップS704において、評価対象領域として特定された5種類の領域について、歪量を算出する。凹部領域と凸部領域と曲線領域と直線型面領域については、まず、図16に示すように、リファレンス文字輪郭上の特定領域内の1つの画素(以下、着目点とする)から法線方向に直線を引く。次に、直線と評価対象文字上の輪郭とぶつかる点(以下、対応点とする)を見つけ、2点間の距離を測定し、着目点における誤差量とする。その誤差量の算出を、注目する特定領域内の全画素に対して行い、総和を求めて、1画素あたりの誤差量の平均値を歪量として算出する。この歪量が閾値(以下、基準値ともいう)以上である領域については、ステップS705において、歪みの低減化処理が行われる。
なお、対応点を見つける上で注意すべきことがあり、図17に示すように、本来取るべき対応点と逆の方向に文字の輪郭がある場合には、別の対応点が存在することになるので、いずれが正しい対応点であるかを判断しなければならない。そこで本実施形態においては、着目点と対応点を結ぶ直線について考え、正しい対応点か否かを判断する。即ち、位置合わせ画像において、図17のケース1に示すように、着目点の位置が評価対象文字に重なっている場合に、着目点と正しい対応点を結ぶ直線は、評価対象文字領域を通過し、それ以外の評価対象文字とリファレンス文字が重なる領域等を通過しない。従って、そのようなケースで対応点が2つある場合には、直線が評価対象文字領域のみを通過する対応点を正しい対応点として選択する。
一方、図17のケース2に示すように、位置合わせ画像において着目点の位置が評価対象文字に重なっていない場合に、正しい対応点と着目点を結ぶ直線は、リファレンス文字内部を通過する。かつ、その直線は、2つの文字が重なる領域や、いずれの文字の内部とならない領域(即ち、2つの文字の外部領域)を通過しない。従って、そのようなケースで対応点が2つある場合には、直線がリファレンス文字領域のみを通過する対応点を正しい対応点として選択する。本実施形態においては、着目点の位置が評価対象文字に重なっている場合といない場合において、それぞれで対応点が2つ発生した場合に、上記に従って正しい対応点を判断することができる。
直線近似領域については、評価対象文字とリファレンス文字との輪郭間で差diffを取り、差diffが閾値以上である場合に、曲率の大きな輪郭が直線化されたとし、歪みの低減化処理の対象とする。また、直線近似領域の場合に、着目点は、既に説明したとおり、評価対象文字の輪郭上にあるので、対応点を検出する処理は、上述の正しい対応点を判断する説明において、評価対象文字とリファレンス文字とを逆にした説明の処理となる。
次に、ステップS705において、歪みの低減化が行われる。本実施形態においては、歪量が閾値以上である領域について、各領域種別毎に最適な低減化処理を施す。
図18は、凹部領域における歪みの低減化方法を説明する図である。本実施形態においては、図18に示すように、検出されている凹点にアンカーポイントを設定する。その結果、凹点を含めたアンカーポイント間のベクトル列によって、凹部領域に発生した歪みを低減化することができる。
図19は、凸部領域における歪みの低減化方法を説明する図である。本実施形態においては、図19に示すように、検出されている凸点にアンカーポイントを設定する。その結果、凸点を含めたアンカーポイント間のベクトル列によって、凸部領域に発生した歪みを低減化することができる。また、図20は、凸部領域における歪みの他の低減化方法を説明する図である。図20においては、相隣接する2つの屈曲点が2つとも凸点である。また、評価対象文字上のアンカーポイント4つ(A〜D)の内、中2つのアンカーポイント(BとC)を結ぶ線分BCが、X軸又はY軸に対して、平行に配置されているとする。更に、端2つのアンカーポイント(AとD)から延びている輪郭が、BCに直交する方向に長い線分である場合には、アンカーポイントは、細長い面型直線の端領域に設定されていると考えられる。そこで、4つのアンカーポイントを消去して、新たに、線分BCとそれぞれの長い線分が交わる点にアンカーポイントを設定する。そのような方法を用いることによって、アンカーポイントを削除して数を減らし、ファイルサイズを低減することができる。また、スキャンした文字の角の部分(凸点)はスキャンノイズのために、画素欠陥等が発生している場合がある。そのような文字に対してどのように精度良くベクトル化を行ったとしても、元々文字が持っている形状を表現することはできない。しかしながら、説明した手法を用いることで、本来文字が持っていた角を再現することができる。
以上のように、本実施形態においては、図18〜20に示すように、アンカーポイントを新たに設定又は削除することによって、凸部領域又は凹部領域に発生した歪みを低減することができる。
次に、曲線領域における歪みの低減化方法について説明する。図21は、図18〜図20と同様に、曲線領域においてアンカーポイントを新たに設定した場合を説明する図である。凹部領域や凸部領域と同様にアンカーポイントを新たに設定すると、図21に示すように、曲線中に窪みが生成されてしまい、品位が低下してしまう。また、生成された窪みを細分化するために更に、新たにアンカーポイントを設定すると、処理時間も増大してしまう。図22は、本実施形態における曲線領域における歪みの低減化方法を説明する図である。本実施形態においては、図22に示すように、コントロールポイントを移動させることによって歪みを低減する。具体的には、リファレンス文字の輪郭と比べて評価対象文字の輪郭が外側に張り出している場合に、コントロールポイントを輪郭側に近づける。近づける距離としては、例えば、コントロールポイントとリファレンス文字の輪郭間の距離の半分とする。逆に、リファレンス文字の輪郭と比べて評価対象文字の輪郭が内側にある場合に、外側に張り出させる必要があるので、コントロールポイントを文字の外側方向に移動させる。移動させる距離としては、例えば、コントロールポイントとリファレンス文字の輪郭間との距離の半分とする。
以上のように、本実施形態においては、図22に示すようにコントロールポイントを操作することによって、曲線領域に発生した歪みを低減することができる。
次に、直線型面領域における歪みの低減化方法について説明する。図15において説明したように、リファレンス文字の輪郭から直線型面領域を特定する過程において、太さを求めている。従って、本実施形態においては、評価対象文字の輪郭上の対応する領域をその太さになるようにアンカーポイントを移動する。その結果、直線型面領域において発生した歪みを低減することができる。
次に、直線近似領域における歪みの低減化方法について説明する。図9において説明したように、長い直線近似領域における歪みは、本来、曲線であるべき部分に歪みが発生して直線に近似されたものである。従って、本実施形態においては、評価対象文字上のアンカーポイント間に、例えば、3次曲線をあてはめるといった一般的に知られている高次関数での曲線近似を行うことによって、直線近似領域に発生した歪みを低減することができる。ここで、3次曲線に限定されず、2次以上の高次曲線(n次曲線、n>=2)で近似するようにしても良い。
以上のように、本実施形態においては、アンカーポイントを移動することによって、直線型面領域に発生した歪みを低減することができ、n次関数近似の手法を用いることにより、直線近似領域に発生した歪みを低減することができる。
本実施形態においては、文字のベクトル化における歪みが発生する領域を5種類に分類し、それぞれの領域に応じて最適な歪みの低減方法を適用している。その結果、単に、リファレンス文字と評価対象文字との輪郭間の誤差量を、文字全体について画一的に低減させる手法よりも、処理時間や品位において効率的に歪みを低減することができる。また、本実施形態においては、歪みの尺度として法線方向の誤差を用いて説明したが、X軸方向の誤差やY軸方向の誤差等、輪郭間の誤差を定義できるのであれば、他の尺度を用いても良い。
また、以上の説明におけるベクトル化歪みを効率的に低減させるためのアルゴリズムは、ソフトウェア、ハードウェア、又は、ソフトウェアとハードウェアの両方を用いることによって実現されるようにしても良い。例えば、最初のベクトル化についてはソフトウェアによって実現され、歪低減処理には複雑な演算処理が必要となるのでハードウェアで実現されるようにしても良い。
また、歪低減処理のスピードアップを図るため、システム全体の中で空いているリソースを適宜利用するようにしても良い。例えば、ブロックセレクション用とベクトル化用に2つのCPUを構成し、メモリは2つのCPUが同時にアクセス可能なデュアルポート対応とする。ブロックセレクション処理が中断している間、又は、完了している場合には、ベクトル化処理のためにブロックセレクション用のCPUを用いることもできる。また他の例として、例えば、ベクトル化処理の前段に位置するブロックセレクション処理において非常に複雑な処理を行う場合に、一部又は全部をハードウェア実装として、リアルタイム処理を可能とすることが考えられる。もし、ハードウェア実装されたブロックセレクションがベクトル化処理の前段にある場合には、ベクトル化処理時において、ブロックセレクションに割り当てられたハードウェア資源が活用されない時間が発生する場合がある。そのような時間において、ハードウェア資源をベクトル化処理のために活用できるようにしても良い。また、本実施形態においては、文字の歪低減手法が、文字の他に、ベクトル化された線画やクリップアートに対して適用されても良い。
本実施形態において、ホスト及び端末の機能を実現するソフトウェアのプログラムコードを記憶したコンピュータ読み取り可能なプログラム記録媒体(記憶媒体ともいう)が、システム或いは装置に供給されるようにしても良い。その場合に、更に、システム或いは装置のコンピュータ(又はCPUやMPU)が記憶媒体に格納されたプログラムコードを読みだして実行しても良い。その場合、記憶媒体から読み出されたプログラム(画像処理プログラム)コード自体が、本実施形態の機能を実現することとなり、そのプログラムコードを記憶した記憶媒体は本発明を構成することとなる。プログラムコードを供給するための記憶媒体としては、ROM、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード等を用いることができる。また、コンピュータが読みだしたプログラムコードを実行して、本実施形態の機能が実現されるだけでなく、プログラムコードの指示に基づきコンピュータ上で稼動しているOS等が実際の処理の一部又は全部を行い、本実施形態が実現される場合も含まれる。記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された拡張機能ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる場合がある。その後に、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部又は全部を行い、その処理によって本実施形態の機能が実現される場合も含まれる。
本発明に係る実施形態における画像処理装置のブロック構成を示す図である。 スキャンデータファイル化部の機能構成を示すブロック図である。 スキャンデータファイル化部の処理の手順を示すフローチャートである。 ベクトル化部の機能構成を示すブロック図である。 歪低減部の機能構成を示すブロック図である。 ベクトル化部において抽出される粗輪郭について説明する図である。 歪低減部の処理の手順を示すフローチャートである。 歪低減部における位置合わせについて説明する図である。 文字上で特定される領域を説明する図である。 凹部領域、凸部領域、曲線領域を特定する処理の手順を示すフローチャートである。 屈曲点について説明する図である。 屈曲部と屈曲部間領域について説明する図である。 屈曲点を凹点と凸点とに分類する方法について説明する図である。 曲線領域を特定する方法を説明する図である。 直線型面領域を特定する方法を説明する図である。 歪量を算出する方法について説明する図である。 正しい対応点を判定する方法を説明する図である。 凹部領域における歪みの低減化方法を説明する図である。 凸部領域における歪みの低減化方法を説明する図である。 凸部領域における歪みの他の低減化方法を説明する図である。 曲線領域においてアンカーポイントを新たに設定した場合を説明する図である。 曲線領域における歪みの低減化方法を説明する図である。
符号の説明
101 スキャン部
102 スキャンデータファイル化部
103 ハードディスク
104 出力ファイル生成部
105 出力部
201 ブロックセレクション部
202 JPEG圧縮部
203 ベクトル化部
204 統合部
205 メモリ
206 歪低減部
207 CPU
208 出力部
401 粗輪郭抽出部
402 アンカーポイント/コントロールポイント決定部
403 アンカーポイント/コントロールポイント書き出し部
501 文字データ取得部
502 位置合わせ部
503 評価対象領域特定部
504 歪量測定部
505 修正部

Claims (8)

  1. 画像に含まれるオブジェクトをベクトル化し出力する画像処理装置であって、
    前記オブジェクトの輪郭線上において、(i)凸に屈曲した屈曲点を有する凸部領域と、(ii)凹に屈曲した屈曲点を有する凹部領域と、(iii)相隣接する屈曲点の間で予め定められた曲率より大きい曲率を有する曲線領域と、を歪みの発生しやすい評価対象領域として特定し、当該特定した評価対象領域において、前記オブジェクトと該オブジェクトをベクトル化したベクトル化オブジェクトとのそれぞれの形状を比較して、前記オブジェクトのベクトル化において発生した歪みの大きさを示す歪量を各評価対象領域について算出する算出手段と、
    前記歪量と予め定められた基準値とを比較し、前記歪量が前記基準値よりも大きいと判断された評価対象領域における前記ベクトル化オブジェクトの形状を前記オブジェクトの形状に近づけて前記歪量を低減するように修正する修正手段と、を備え
    前記修正手段は、
    (i)前記歪量が前記基準値よりも大きいと判断された前記ベクトル化オブジェクトの前記凸部領域において、前記オブジェクトの前記凸に屈曲した屈曲点に対応する点にアンカーポイントを設定し、
    (ii)前記歪量が前記基準値よりも大きいと判断された前記ベクトル化オブジェクトの前記凹部領域において、前記オブジェクトの前記凹に屈曲した屈曲点に対応する点にアンカーポイントを設定し、
    (iii)前記歪量が前記基準値よりも大きいと判断された前記ベクトル化オブジェクトの前記曲線領域において、前記オブジェクトの前記曲線領域に対応する点にコントロールポイントを移動させる、
    ことによって前記ベクトル化オブジェクトの形状を修正し、
    前記修正手段は、前記歪量が前記基準値よりも大きいと判断された前記ベクトル化オブジェクトの相隣接する2つの前記凸部領域について前記ベクトル化オブジェクトの形状を修正する場合に、当該2つの前記凸部領域について輪郭線上に並ぶ4つのアンカーポイントのうち、中2つのアンカーポイントを結ぶ第1の線分が端2つのアンカーポイントそれぞれから延びる第2の線分と直交するならば、前記第1の線分と前記第2の線分それぞれとが交わる点にアンカーポイントを設定して、前記4つのアンカーポイントを消去する、
    ことを特徴とする画像処理装置。
  2. 前記算出手段は、前記オブジェクトと前記ベクトル化オブジェクトとを重ね合わせて、それぞれの形状を比較し、前記オブジェクトの輪郭と前記ベクトル化オブジェクトの輪郭との間に発生する差分を前記歪量として算出することを特徴とする請求項1記載の画像処理装置。
  3. 前記差分は、前記オブジェクトの輪郭と前記ベクトル化オブジェクトの輪郭との内、一方の輪郭上において着目された点から法線方向の距離であることを特徴とする請求項2記載の画像処理装置。
  4. 前記算出手段は、前記オブジェクトの輪郭線上において、(iv)相隣接する屈曲点の間において、前記オブジェクトが線芯化された芯線と平行である第1の直線形状領域と、(v)前記ベクトル化オブジェクトの輪郭が、前記ベクトル化オブジェクトに外接する外接矩形の縦方向と横方向の長さの内、短い方の長さの半分以上の長さを有する直線である第2の直線形状領域と、をさらに前記評価対象領域として特定し、
    前記修正手段は、
    (iv)前記ベクトル化オブジェクトの前記第1の直線形状領域において、当該第1の直線形状領域の前記芯線に対する太さが一定となるようにアンカーポイントを移動し、
    (v)前記ベクトル化オブジェクトの前記第2の直線形状領域において、曲線近似を行うことによって、前記ベクトル化オブジェクトの形状を修正する、
    ことを特徴とする請求項1乃至3のいずれか1項記載の画像処理装置。
  5. 前記屈曲点が、前記オブジェクトの輪郭上に位置する画素列の角度が予め定められた角度以上に屈曲した点であることを特徴とする請求項4記載の画像処理装置。
  6. 画像に含まれるオブジェクトをベクトル化し出力する画像処理装置において実行される画像処理方法であって、
    前記画像処理装置の算出手段が、前記オブジェクトの輪郭線上において、(i)凸に屈曲した屈曲点を有する凸部領域と、(ii)凹に屈曲した屈曲点を有する凹部領域と、(iii)相隣接する屈曲点の間で予め定められた曲率より大きい曲率を有する曲線領域と、を歪みの発生しやすい評価対象領域として特定し、当該特定された評価対象領域において、前記オブジェクトと該オブジェクトをベクトル化したベクトル化オブジェクトとのそれぞれの形状を比較して、前記オブジェクトのベクトル化において発生した歪みの大きさを示す歪量を各評価対象領域について算出する算出工程と、
    前記画像処理装置の修正手段が、前記歪量と予め定められた基準値とを比較し、前記歪量が前記基準値よりも大きいと判断された評価対象領域における前記ベクトル化オブジェクトの形状を前記オブジェクトの形状に近づけて前記歪量を低減するように修正する修正工程と、を有し、
    前記修正工程は、
    (i)前記歪量が前記基準値よりも大きいと判断された前記ベクトル化オブジェクトの前記凸部領域において、前記オブジェクトの前記凸に屈曲した屈曲点に対応する点にアンカーポイントを設定し、
    (ii)前記歪量が前記基準値よりも大きいと判断された前記ベクトル化オブジェクトの前記凹部領域において、前記オブジェクトの前記凹に屈曲した屈曲点に対応する点にアンカーポイントを設定し、
    (iii)前記歪量が前記基準値よりも大きいと判断された前記ベクトル化オブジェクトの前記曲線領域において、前記オブジェクトの前記曲線領域に対応する点にコントロールポイントを移動させる、
    ことによって前記ベクトル化オブジェクトの形状を修正し、
    前記修正工程は、前記歪量が前記基準値よりも大きいと判断された前記ベクトル化オブジェクトの相隣接する2つの前記凸部領域について前記ベクトル化オブジェクトの形状を修正する場合に、当該2つの前記凸部領域について輪郭線上に並ぶ4つのアンカーポイントのうち、中2つのアンカーポイントを結ぶ第1の線分が端2つのアンカーポイントそれぞれから延びる第2の線分と直交するならば、前記第1の線分と前記第2の線分それぞれとが交わる点にアンカーポイントを設定して、前記4つのアンカーポイントを消去する、
    ことを特徴とする画像処理方法。
  7. 請求項6記載の画像処理方法の各工程をコンピュータに実行させる画像処理プログラム。
  8. 請求項7記載の画像処理プログラムを格納するコンピュータ読取可能な記憶媒体。
JP2008033625A 2008-02-14 2008-02-14 画像処理装置、画像処理方法、画像処理プログラム、及び、記憶媒体 Expired - Fee Related JP4991590B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008033625A JP4991590B2 (ja) 2008-02-14 2008-02-14 画像処理装置、画像処理方法、画像処理プログラム、及び、記憶媒体
US12/369,357 US8238686B2 (en) 2008-02-14 2009-02-11 Image processing apparatus, method and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008033625A JP4991590B2 (ja) 2008-02-14 2008-02-14 画像処理装置、画像処理方法、画像処理プログラム、及び、記憶媒体

Publications (2)

Publication Number Publication Date
JP2009193361A JP2009193361A (ja) 2009-08-27
JP4991590B2 true JP4991590B2 (ja) 2012-08-01

Family

ID=40955195

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008033625A Expired - Fee Related JP4991590B2 (ja) 2008-02-14 2008-02-14 画像処理装置、画像処理方法、画像処理プログラム、及び、記憶媒体

Country Status (2)

Country Link
US (1) US8238686B2 (ja)
JP (1) JP4991590B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5566158B2 (ja) * 2010-03-30 2014-08-06 キヤノン株式会社 画像処理方法、画像処理装置、及びプログラム
JP5629483B2 (ja) * 2010-03-30 2014-11-19 キヤノン株式会社 画像処理方法、画像処理装置、及びプログラム
JP5802524B2 (ja) * 2011-11-21 2015-10-28 株式会社Pfu 画像処理装置、画像処理方法、および画像処理プログラム
JP6000992B2 (ja) * 2014-01-24 2016-10-05 京セラドキュメントソリューションズ株式会社 文書ファイル生成装置及び文書ファイル生成方法
US9524445B2 (en) * 2015-02-27 2016-12-20 Sharp Laboratories Of America, Inc. Methods and systems for suppressing non-document-boundary contours in an image
IT202000006463A1 (it) 2020-03-27 2021-09-27 Casagrande Spa Macchina perforatrice
CN116823778A (zh) * 2022-04-13 2023-09-29 深圳北芯生命科技股份有限公司 目标路径中相邻点对的连线方法及相关标注方法、设备

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58134747A (ja) * 1982-02-04 1983-08-11 Photo Composing Mach Mfg Co Ltd 文字デ−タ圧縮用標本点設定方式
JPS61208184A (ja) * 1985-03-12 1986-09-16 Fujitsu Ltd パタ−ン情報量圧縮方式
JPS6237787A (ja) * 1985-08-10 1987-02-18 Fujitsu Ltd パタ−ン情報量圧縮方式
JPH07101448B2 (ja) * 1986-10-20 1995-11-01 富士通株式会社 線図形自動整形装置
US5644654A (en) 1987-04-06 1997-07-01 Canon Kabushiki Kaisha Image processing apparatus capable of efficient coding of complex shape information
JPS63249193A (ja) * 1987-04-06 1988-10-17 キヤノン株式会社 画像デ−タの圧縮方式
JPS63301382A (ja) * 1987-06-02 1988-12-08 Meidensha Electric Mfg Co Ltd 文字成分分離方法
JP2930599B2 (ja) * 1989-05-20 1999-08-03 株式会社リコー 図形ベクトル化処理方法及び装置
JPH0326592A (ja) 1989-06-23 1991-02-05 Nippon Zeon Co Ltd 顕色シート用塗工組成物及び顕色シート
IT1231642B (it) 1989-07-13 1991-12-18 Polese Pasquale Bocchino con filtro per sigarette atto ad eliminare il vizio del fumo
JP2885476B2 (ja) * 1990-05-31 1999-04-26 株式会社東芝 画像処理方法および装置
JPH04112385A (ja) * 1990-09-03 1992-04-14 Fujitsu Ltd ベクトル近似方式
JPH04147383A (ja) * 1990-10-09 1992-05-20 Nec Off Syst Ltd 画像修正方式
JP3026592B2 (ja) * 1990-10-22 2000-03-27 キヤノン株式会社 輪郭抽出方法及びその装置
JPH0528260A (ja) * 1991-07-19 1993-02-05 Meidensha Corp 輪郭ベクトル抽出方式
JP2910344B2 (ja) 1991-07-31 1999-06-23 日本ビクター株式会社 画像処理方法
JP3049672B2 (ja) * 1991-12-26 2000-06-05 キヤノン株式会社 画像処理方法及び装置
JP2882212B2 (ja) * 1992-10-15 1999-04-12 日本電気株式会社 曲線円滑化方式
JPH06290264A (ja) * 1993-03-31 1994-10-18 Nec Software Ltd 画像データの自動歪み補正システム
JP2845107B2 (ja) 1993-10-27 1999-01-13 三菱電機株式会社 画像処理装置
US7751482B1 (en) * 2004-02-27 2010-07-06 Vbrick Systems, Inc. Phase correlation based motion estimation in hybrid video compression
US7430336B2 (en) * 2004-05-06 2008-09-30 Qualcomm Incorporated Method and apparatus for image enhancement for low bit rate video compression
US7590589B2 (en) * 2004-09-10 2009-09-15 Hoffberg Steven M Game theoretic prioritization scheme for mobile ad hoc networks permitting hierarchal deference
TWI296178B (en) * 2005-12-12 2008-04-21 Novatek Microelectronics Corp Image vibration-compensating apparatus and the method thereof
US7813537B2 (en) * 2006-05-15 2010-10-12 Siemens Medical Solutions Usa, Inc. Motion-guided segmentation for cine DENSE images

Also Published As

Publication number Publication date
US8238686B2 (en) 2012-08-07
JP2009193361A (ja) 2009-08-27
US20090208130A1 (en) 2009-08-20

Similar Documents

Publication Publication Date Title
JP4991590B2 (ja) 画像処理装置、画像処理方法、画像処理プログラム、及び、記憶媒体
US10289924B2 (en) System and method for scanned document correction
JP5017031B2 (ja) 画像処理装置、画像処理方法、画像処理プログラム、並びに、記憶媒体
US8457403B2 (en) Method of detecting and correcting digital images of books in the book spine area
JP5934762B2 (ja) 文字の形状特徴を使用した文字比較による文書改変検知方法、コンピュータプログラム、記録媒体および情報処理装置
JP4310288B2 (ja) 画像処理装置及びその方法、プログラム並びに記憶媒体
JP2000020682A (ja) 画像補正装置
US20030118211A1 (en) Watermark information extraction apparatus and method of controlling thereof
US6947596B2 (en) Character recognition method, program and recording medium
JP5541679B2 (ja) 画像処理装置及び方法、並びに、プログラム
US8064636B2 (en) Image processing apparatus and method of controlling the same
CN115619656A (zh) 数字化档案纠偏矫正方法及系统
US20020027672A1 (en) Distortion correction device for correcting imaged object to produce plane image without distortion
JP5049922B2 (ja) 画像処理装置及び画像処理方法
US7961941B2 (en) Color form dropout using dynamic geometric solid thresholding
KR100603618B1 (ko) 어파인 변환을 이용한 문서 영상의 기하학적 왜곡 보정장치 및 방법
US6330360B1 (en) Image processing apparatus and method
JP4803001B2 (ja) 画像処理装置及び画像処理プログラム
JP5056063B2 (ja) 画像処理装置及び画像処理プログラム
JP2008113145A (ja) 画像処理装置及び画像処理プログラム
JP3885001B2 (ja) 画像処理方法及び画像処理装置
JP4070486B2 (ja) 画像処理装置、画像処理方法及び同方法の実行に用いるプログラム
JPH0850650A (ja) 図形清書化装置
JP2009193170A (ja) 文字認識装置及び文字認識方法
JPH11250179A (ja) 文字認識装置および文字認識方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110209

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120120

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120321

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120406

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120507

R151 Written notification of patent or utility model registration

Ref document number: 4991590

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150511

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees