JP4770590B2 - アウトラインの作成装置および作成方法、並びに画像処理装置 - Google Patents

アウトラインの作成装置および作成方法、並びに画像処理装置 Download PDF

Info

Publication number
JP4770590B2
JP4770590B2 JP2006146209A JP2006146209A JP4770590B2 JP 4770590 B2 JP4770590 B2 JP 4770590B2 JP 2006146209 A JP2006146209 A JP 2006146209A JP 2006146209 A JP2006146209 A JP 2006146209A JP 4770590 B2 JP4770590 B2 JP 4770590B2
Authority
JP
Japan
Prior art keywords
pixel
level
boundary line
edge position
boundary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006146209A
Other languages
English (en)
Other versions
JP2007316964A5 (ja
JP2007316964A (ja
Inventor
智宏 安岡
哲二郎 近藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2006146209A priority Critical patent/JP4770590B2/ja
Priority to US11/748,868 priority patent/US7957594B2/en
Priority to CN2007101045917A priority patent/CN101079150B/zh
Publication of JP2007316964A publication Critical patent/JP2007316964A/ja
Publication of JP2007316964A5 publication Critical patent/JP2007316964A5/ja
Application granted granted Critical
Publication of JP4770590B2 publication Critical patent/JP4770590B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/457Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by analysing connectivity, e.g. edge linking, connected component analysis or slices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/287Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Description

この発明は、静止画像の第1、第2のレベルの領域の境界を示すアウトラインを作成するアウトライン作成装置、アウトライン作成方法および画像処理装置に関する。詳しくは、この発明は、第1、第2のレベル間のレベルを持つ各エッジ位置の画素に対応して、エッジ位置およびその周辺の画素のデータ値に基づき、画素内における第1、第2のレベル領域の境界を示す境界線を生成し、それら生成された各境界線を連結してアウトラインを求めることによって、画素単位ではなく実数精度でアウトラインを作成可能としたアウトライン作成装置等に係るものである。
従来、画像処理の分野では、種々の目的のために、静止画像のエッジ位置を検出することが行われている。例えば、特許文献1には、画像データを高い圧縮率で符号化する方法として、画像データそのものを符号化するのではなく、画像データのエッジを連続的に検出して連続的なエッジデータを符号化することが記載されている。また例えば、特許文献2には、製造途中で重ね合わせマークを用いて回路パターンの重ね合わせ状態の検査をする際に、CCDカメラの撮像画像からエッジ位置(マーク位置)を検出することが行われている。このエッジ位置の検出は、例えば画素のデータ値が急激に変化する部分を検出することで行われる。
特開平8−36641号公報 特開2004−79970号公報
上述の特許文献1、特許文献2に記載されるエッジ位置の検出では、エッジの位置を画素単位で検出するものである。しかし、このエッジ位置が例えば黒レベル領域および白レベル領域の境界を示すアウトラインである場合、例えば画素数の増加による画像の拡大処理を考えると、画素単位より細かな単位でのエッジ位置検出が望まれる。
この発明の目的は、画素単位ではなく実数精度でアウトラインを作成可能とすることにある。
この発明の概念は、
静止画像を構成する各画素より第1のレベルと該第1のレベルより大きな第2のレベルとの間のレベルを持つエッジ位置の画素を検出するエッジ検出部と、
上記エッジ検出部で検出された各エッジ位置の画素にそれぞれ対応して該エッジ位置の画素および該エッジ位置の画素の周辺に位置する画素を切り出す画素切り出し部と、
上記エッジ検出部で検出される各エッジ位置の画素のそれぞれに対応して、上記画素切り出し部で切り出された画素のデータ値に基づき、画素内における上記第1のレベルの領域と上記第2のレベルの領域との境界を示す境界線を生成する境界線生成部と、
上記エッジ検出部で検出された各エッジ位置の画素のそれぞれに対応して上記境界線生成部で生成された境界線を連結して、上記静止画像における上記第1のレベルの領域と上記第2のレベルの領域との境界を示すアウトラインを求める連結処理部とを備え
上記境界線生成部は、
上記エッジ位置の画素のデータ値と上記周辺に位置する画素のデータ値との差に基づいて上記境界線の角度を検出する境界線角度検出部と、
上記エッジ位置の画素のデータ値に対応した上記第1のレベルおよび上記第2のレベルの混入率に基づいて、上記境界線角度検出部で検出された角度の境界線の切片を検出する境界線切片検出部とからなり、
上記画素切り出し部は、
上記エッジ位置の画素に対して水平方向の左右にそれぞれ隣接する画素d2,d1と、上記エッジ位置の画素に対して垂直方向の上下にそれぞれ隣接する画素d3,d4とを切り出し、
上記境界線角度検出部は、
水平方向成分d2−d1および垂直方向成分d4−d3からなる差ベクトルの方向に90度だけ加算した角度を境界線の角度とす
ことを特徴とするアウトライン作成装置。
この発明においては、静止画像を構成する各画素のデータより第1のレベル(例えば黒レベル)と第2のレベル(例えば白レベル)との間のレベルを持つエッジ位置の画素が検出される。このエッジ位置の検出は画素単位で行われるものである。この発明では、さらに各エッジ位置の画素を用いて、第1のレベルの領域と第2のレベルの領域との境界を示すアウトラインが実数精度で作成される。ここで、第1、第2のレベルは、それぞれ、ある一つのレベル、あるいは所定の幅を持ったレベルを意味している。
すなわち、各エッジ位置の画素にそれぞれ対応して、このエッジ位置の画素およびその周辺に位置する画素が切り出され、それらの画素のデータ値に基づき、画素内における第1のレベルの領域と第2のレベルの領域との境界を示す境界線が生成される。
この場合、例えば、このエッジ位置の画素のデータ値とその周辺に位置する画素のデータ値との差に基づいて、境界線の角度が検出される。さらに、エッジ位置の画素のデータ値に対応した第1のレベルおよび第2のレベルの混入率に基づいて、上述の角度検出された境界線の切片が検出される。ここで、切片とは境界線の画素枠との交点の座標をいう。この切片によって、境界線の画素上の位置が特定される。
各エッジ位置の画素のそれぞれに対応して生成された境界線が連結されて、静止画像における第1のレベルの領域と第2のレベルの領域との境界を示すアウトラインが求められる。例えば、各エッジ位置の画素に対応した境界線の方向はそれぞれ左側または右側にデータ値の高い画素が存在するように設定され、第1の境界線に連結される第2の境界線はこの第1の境界線の終点に最も近い始点を持つ境界線とされる。
このように、第1、第2のレベル間のレベルを持つ各エッジ位置の画素に対応して、エッジ位置およびその周辺の画素のデータ値に基づき、画素内における第1、第2のレベル領域の境界を示す境界線が生成され、その後に各境界線が連結されてアウトラインが求められるものであり、画素単位ではなく実数精度でアウトラインが作成される。
例えば、このように作成されたアウトラインに基づいて、画素数を増加した静止画像のデータが生成される。この場合、作成されたアウトラインにより静止画像における第1のレベルの領域と第2のレベルの領域との境界が実数精度で示されるため、画素数の増加時におけるアウトライン部分でそのレベルが第1のレベルおよび第2のレベルの中間値となる画素の個数を少なくでき、アウトライン部分が明瞭な拡大画像が得られる。
この発明によれば、第1、第2のレベル間のレベルを持つ各エッジ位置の画素に対応して、エッジ位置およびその周辺の画素のデータ値に基づき、画素内における第1、第2のレベル領域の境界を示す境界線を生成し、それら生成された各境界線を連結してアウトラインを求めるものであり、画素単位ではなく実数精度でアウトラインを作成できる。
以下、図面を参照しながら、この発明の実施の形態について説明する。図1は、実施の形態としての画像処理装置100の構成を示している。この画像処理装置100は、CPU(Central Processing Unit)101と、ROM(Disk ReadOnly Memory)102と、RAM(Random Access Memory)103と、画像メモリ104と、マウスあるいはキーボードなどのユーザ操作部105と、スキャナ106と、カメラ107と、ディスプレイ108と、プリンタ109とが、バス110に接続されて構成されている。
CPU101は、装置全体の動作を制御する。ROM102は、CPU101の動作に必要なプログラムおよびデータを格納している。RAM103は、CPU101の作業領域等を構成している。スキャナ106およびカメラ107は静止画像データの入力部を構成している。また、ディスプレイ108およびプリンタ109は、静止画像データの出力部を構成している。ここで、静止画像データは複数の画素データからなる白黒の画像データであって、各画素データはそれぞれ例えば0〜255の値をとる8ビットデータである。
図1に示す画像処理装置100においては、スキャナ106あるいはカメラ107で得られる静止画像データは、ユーザ操作部105のよるユーザ操作に対応して、CPU101により処理される。そして、処理後の静止画像データがディスプレイ108あるいはプリンタ109に供給され、画像表示あるいは印画される。
ここで、静止画像データに対するCPU101の処理として、画像を拡大する処理が行われる。この画像拡大処理では、ユーザ操作で指定された拡大率に対応して、拡大対象の画像領域に対応した画素数が拡大率に応じて増加される。例えば、拡大率が2であるときは、1/2の画像領域が拡大対象とされ、その画像領域に対応した画素数が2倍に増加される。
CPU101は、この画像拡大処理を行うために、アウトライン作成部と、データ生成部とを構成している。アウトライン作成部は、画像メモリ104に蓄積されている処理前の静止画像データに基づいて、第1のレベルとしての黒レベルの領域と、第2のレベルとしての白レベルの領域との境界を求める。また、データ作成部は、アウトライン作成部で作成されたアウトラインに基づいて、拡大対象の画像領域の画素数を増加して拡大画像用の静止画像データを生成する。
図2は、アウトライン作成部200の機能ブロックを示している。このアウトライン作成部200は、エッジ検出部201と、画素切り出し部202と、境界線角度検出部203と、境界線切片検出部204と、連結処理部205とを有している。境界線角度検出部203および境界線切片検出部204は、境界線生成部を構成している。
エッジ検出部201は、静止画像を構成する各画素より、黒レベルと白レベルとの間のレベルを持つエッジ位置の画素を検出する。ここでは、黒レベルのデータ値を「0」、白レベルのデータ値を「255」とし、「1」〜「254」のデータ値を持つ画素はエッジ位置の画素として検出される。なお、黒レベルは「0〜10」、白レベルは「245〜255」のように、黒レベルおよび白レベルに所定の幅を持たせるようにしてもよい。
画像切り出し部202は、エッジ検出部201で検出された各エッジ位置にそれぞれ対応して、このエッジ位置の画素およびその周辺に位置する画素を切り出す。図3は、静止画像の画素構造を示しており、水平方向がN画素、垂直方向がM画素となるように、マトリクス状に画素は配置されている。
図4Aは、切り出される画素の一例を示している。この場合、エッジ位置の画素d0と、この画素d0に対して垂直方向の上下それぞれ隣接する画素d3,d4と、この画素d0に対して水平方向の左右にそれぞれ隣接する画素d2,d1が切り出される。
境界線角度検出部203は、各エッジ位置の画素に対応して、エッジ位置の画素のデータ値と、その周辺に位置する画素のデータ値との差に基づいて、画素内における黒レベルの領域と白レベルの領域との境界を示す境界線の角度を検出する。この場合、図4Bに示すように、水平方向成分d2−d1(=d2−d0+d0−d1)および垂直方向成分d4−d3(=d4−d0+d0−d3)からなる、差ベクトルVCの方向に90度だけ加算した角度(波線矢印で図示)が境界線の角度となる。
境界線切片検出部204は、各エッジ位置の画素に対応して、エッジ位置の画素のデータ値に対応した黒レベルおよび白レベルの混入率に基づいて、図4Cに示すように、境界線角度検出部203で検出された角度にある境界線の切片、つまり境界線の画素枠との交点の座標(xs,ys),(xe,ye)を検出する。この場合、境界線で仕切られる正方形画素の黒レベル領域Sbと白レベル領域Swとの面積比が、上述した黒レベルおよび白レベルの混入率に対応した値となるようにする。
これにより、各エッジ位置の画素のそれぞれに対応して、画素内における黒レベル領域と白レベル領域との境界を示す境界線BLが生成される。この境界線BLは、エッジ位置の画素内における黒レベルの領域と白レベルの領域との境界を示すものとなる。なお、この境界線BLの方向は、左側または右側、この実施の形態では右側にデータ値の高い画素が存在するように設定される。このとき、図4Cに示すように、座標(xs,ys)は境界線BLの始点となり、座標(xe,ye)は境界線BLの終点となる。
連結処理部205は、上述した境界線生成部(境界線角度検出部203および境界線切片部204)で生成された各エッジ位置の画素の境界線を連結して、静止画像における黒レベルの領域と白レベルの領域との境界を示すアウトラインを求める。この場合、図5Aに示すように、第1の境界線BLに連結する第2の境界線BLを、この第1の境界線の終点に最も近い始点を持つ境界線とする。
なお、図5Aでは、第1の境界線BLの終点と第2の境界線BLの始点とが接続されている。しかし、これら終点および始点の座標は一致しないことが多い。したがって、この連結処理の段階では、図5Bに示すように、連結すべき2つの境界線BLの中点同士が直線BL′で接続されていく。この場合、この直線BL′がアウトラインを構成することになる。
図2に示すアウトライン作成部200の動作を、図6〜図8のフローチャートに沿って説明する。
図6は、アウトライン作成処理の処理手順を示している、ステップST1で、処理を開始し、ステップST2で、各エッジ位置の画素に対応した境界線BLを生成する。次に、ステップST3で、ステップST2で生成された各境界線BLを連結してアウトラインを求め、その後にステップST4で、処理を終了する。
図7は、図6のステップST2における境界線生成処理の処理手順の詳細を示している。ステップST11で、処理を開始し、ステップST12で、画面上の左上の画素d(0,0)を注目画素に設定する(図3参照)。そして、ステップST13で、注目画素がエッジ位置の画素か否かを判定する。この場合、注目画素のデータ値が、黒レベルのデータ値「0」および白レベルのデータ値「255」の間のデータ値であるときは、エッジ位置の画素と判定する。
ここで、図9に示すような文字画像を静止画像の一例として説明する。図10は、図9の一部(矢印Pで図示)を拡大して示したものであり、付された数値は各画素のデータ値を示している。この例の場合、「65」、「233」、「29」、「201」、「2」、「138」、「63」、「225」、「12」「144」のデータ値の画素は、エッジ位置の画素となる。
注目画素がエッジ位置の画素であるときは、ステップST14で、境界線角度および境界線切片を検出して、注目画素の境界線を生成する。まず、注目画素(エッジ位置の画素)のデータ値と、その周辺に位置する画素のデータ値との差に基づいて、境界線の角度を検出する(図4A,B参照)。例えば、図10に矢印Qで示している、データ値が「138」である画素が注目画素であるとき、d0=138、d1=、d2=255、d3=、d4=255であり、差ベクトルVCの水平方向成分d2−d1=255、差ベクトルの垂直方向成分d4−d3=253であって、境界線の角度は図11に矢印Rで示すように、ほぼ右下45度の角度となる。
次に、注目画素(エッジ位置の画素)のデータ値に対応した黒レベルおよび白レベルの混入率に基づいて、境界線の切片を検出する(図4C参照)。例えば、データ値が「138」である画素が注目画素であるとき、黒レベル「0」が46%混入し、白レベル「255」が54%混入したものである。そのため、正方形画素の黒レベル領域Sbと白レベル領域Swとの面積比が46:54となるように切片を検出する。
このステップST14の処理の後にステップST15に進む。ステップST13で、注目画素がエッジ位置の画素でないときは、直ちにステップST15に進む。このステップST15では、ラスター順で、次の画素が存在するか否かを判定する。ここで、ラスター順とは、図3に示す画素構造で、d(0,0)→d(0,1)→・・・→d(0,N-1)→d(1,0)→d(1,1)→・・・→d(1,N-1)→・・・→d(M-2,0)→d(M-2,1)→・・・→d(M-2,N-1)→d(M-1,0)→d(M-1,1)→・・・→d(M-1,N-1)の順である。
次の画素が存在するときは、ステップST16で、次の画素を注目画素に設定し、その後にステップST13に戻り、上述したと同様の処理をする。一方、次の画素が存在しないときは、ステップST17で、処理を終了する。
図7のフローチャートに沿って境界線生成処理を行うことで、図12に示すように、各エッジ位置の画素に対応した境界線BLを生成できる。
図8は、図6のステップST3における境界線連結処理の処理手順の詳細を示している。ステップST21で、処理を開始し、ステップST22で、画面上の左上の画素d(0,0)を注目画素に設定する(図3参照)。そして、ステップST23で、注目画素に境界線が存在するか否かを判定する。境界線が存在するときは、ステップST24で、その境界線は連結処理で使用済みか否かを判定する。使用済みでないときは、ステップST25で、注目画素を連結処理画素に設定する。
次に、ステップST26で、連結処理画素の近傍、例えば隣接する画素に連結可能な境界線があるか否かを判定する。連結可能な境界線があるときは、ステップST27で、連結処理画素の境界線を、その終点に最も近い始点を持つ境界線と連結する。そして、ステップST28で、連結した境界線に使用済みフラグをたて、その境界線を持つ画素を連結処理画素に設定して、その後にステップST26に戻って、上述したと同様の処理をする。
ステップST26で、連結可能な境界線がないときは、ステップST29で、一連の連結結果を形状として記憶し、その後にテップST30に進む。ステップST23で注目画素に境界線が存在しないとき、およびステップST24で境界線が使用済みであるとき、直ちに、ステップST30に進む。
このステップST30では、ラスター順で次の画素が存在するか否かを判定する。次の画素が存在するときは、ステップST31で、次の画素を注目画素に設定し、その後にステップST23に戻り、上述したと同様の処理をする。一方、次の画素が存在しないときは、ステップST32で、処理を終了する。
図8のフローチャートに沿って境界線連結処理を行うことで、各エッジ位置の画素の境界線の連結を行うことができ、静止画像における黒レベルと白レベルとの境界を示すアウトラインを実数精度で作成できる。図13は、図9の静止画像に対応したアウトラインの作成結果を示している。
次に、上述したアウトライン作成部で作成されたアウトラインを用いて拡大画像用の静止画像データを生成するデータ作成部について説明する。このデータ作成部では、拡大率をERとするとき、1/ERの画像領域を拡大対象とする。例えば、ER=2であるときは、1/2の画像領域が拡大対象とされる。そして、このデータ作成部では、拡大対象の画像領域の画素数をER倍に増加して、拡大画像用の静止画像データを生成する。この拡大率は水平方向および垂直方向がそれぞれ独立して設定可能とされている。
図14は、データ生成部300の機能ブロックを示している。このデータ生成部300は、画素数増加部301と、データ値決定部302とを有している。画素数増加部301は、拡大対象の画像領域の水平方向および垂直方向の画素数を、それぞれ、拡大率に応じて増加する。
データ値決定部302は、画素数増加後の各画素のデータ値を、アウトライン作成部で作成されたアウトラインの位置に応じて決定する。つまり、アウトラインが存在しない画素のデータ値を、その画素が黒レベル領域にあるときは「0」とし、その画素が白レベル領域にあるときは「255」に決定する。また、アウトラインが存在する画素のデータ値は、当該画素における黒レベル領域と白レベル領域との面積比に応じて決定する。この場合、白レベル領域の割合が高くなる程データ値は大きくなる。
図15を参照して、データ作成部の処理動作を説明する。図15Aは、画素数を増加する前の画素例を示しており、上述のアウトライン作成部では、データ値が「123」、「185」の画素はエッジ位置画素とされ、図15Bに示すように、黒レベル「0」の領域と白レベル「255」の領域との境界を示すアウトラインが作成される。データ生成部では、まず、図15Cに示すように、設定された拡大率に応じて水平方向および垂直方向の画素数が増加される。そして、図15Dに示すように、アウトラインの位置に応じて、各画素のデータ値が決定される。
図1に示す画像処理装置100によれば、CPU101で構成されるアウトライン作成部200(図2参照)は、黒レベルと白レベルとの間のレベルを持つ各エッジ位置の画素に対応して、エッジ位置およびその周辺の画素のデータ値に基づき、画素内における黒レベル領域と白レベル領域との境界を示す境界線BLを生成し(図4参照)、それら生成された各境界線を連結してアウトラインを求めるものであり(図5参照)、画素単位ではなく実数精度でアウトラインを作成できる。
また、図1に示す画像処理装置100によれば、CPU101で構成されるデータ生成部300(図14参照)は、設定された拡大率で拡大対象の画像領域の画素数を増加したのち、アウトライン作成部200で作成されたアウトラインに基づいて各画素のデータ値を決定するものであり(図15参照)、当該アウトラインは静止画像における黒レベル領域と白レベル領域との境界を実数精度で示しているため、画素数の増加時におけるアウトライン部分でそのレベルが黒レベルおよび白レベルの中間値となる画素の個数を少なくでき、アウトライン部分が明瞭な拡大画像を得ることができる。
例えば、図16Bは、図15Bに示すようなアウトラインを作成せずに、図16Aに示す画素(図15Aに示す画素と同じ)のみを用いて画素数を増加した場合の各画素のデータ値を示しているが、アウトライン部分における「0」と「255」の間のデータ値となる画素の個数は、図15Dに示すものに比べて多くなっている。
図17Bは、図17Aの画像(図15A、図16Aに対応)に対応した拡大画像であって、アウトラインを作成した後にそれを用いて生成された拡大画像用の静止画像データによるものであり、アウトライン部分が明瞭な拡大画像となっている。これに対して、図18Bは、図18Aの画像(図15A、図16Aに対応)に対応した拡大画像であって、アウトラインを作成せずに生成された拡大画像用の静止画像データによるものであり、アウトライン部分が不明瞭でぼけた拡大画像となっている。
なお、上述実施の形態においては、静止画像における黒レベルと白レベルとの境界を示すアウトラインを求めるものを示したが、この発明は、一般的に第1のレベルとこの第1のレベルより大きな第2のレベルとの境界を示すアウトラインを、同様にして求めることができる。
また、上述実施の形態においては、画像拡大処理においてアウトラインを作成して用いるものを示したが、このように作成されたアウトラインは、スキャナ技術などのその他の用途にも用いることができることは勿論である。
この発明は、画素単位ではなく実数精度でアウトラインを作成できるものであり、画像の拡大処理を行う画像処理装置等に適用できる。
実施の形態としての画像処理装置の構成を示すブロック図である。 アウトライン作成部の機能ブロックを示すブロック図である。 画素構造を示す図である。 境界線角度および境界線切片の検出処理を説明するための図である。 境界線の連結処理を説明するための図である。 境界線作成処理の処理手順を示すフローチャートである。 境界線生成処理の処理手順を示すフローチャートである。 境界線連結処理の処理手順を示すフローチャートである。 静止画像の一例を示す図である。 静止画像の一部を拡大し、エッジ位置の画素を示した図である。 差ベクトルと境界線角度との関係を示す図である。 各エッジ位置画素で生成された境界線を示した図である。 アウトラインの作成結果を示す図である。 データ生成部の機能ブロックを示すブロック図である。 データ作成部の処理を説明するための図である。 アウトラインを作成せずに画素数の増加を行った場合における各画素のデータ値を示す図である。 アウトライン作成による拡大画像の一例を示す図である。 アウトライン不作成による拡大画像の一例を示す図である。
符号の説明
100・・・画像処理装置、101・・・CPU、102・・・ROM、103・・・RAM、104・・・画像メモリ、105・・・ユーザ操作部、106・・・スキャナ、107・・・カメラ、108・・・ディスプレイ、109・・・プリンタ、110・・・バス、200・・・アウトライン作成部、201・・・エッジ検出部、202・・・画素切り出し部、203・・・境界線角度検出部、204・・・境界線切片検出部、205・・・連結処理部、300・・・データ生成部、301・・・画素数増加部、302・・・データ値決定部

Claims (4)

  1. 静止画像を構成する各画素より第1のレベルと該第1のレベルより大きな第2のレベルとの間のレベルを持つエッジ位置の画素を検出するエッジ検出部と、
    上記エッジ検出部で検出された各エッジ位置の画素にそれぞれ対応して該エッジ位置の画素および該エッジ位置の画素の周辺に位置する画素を切り出す画素切り出し部と、
    上記エッジ検出部で検出される各エッジ位置の画素のそれぞれに対応して、上記画素切り出し部で切り出された画素のデータ値に基づき、画素内における上記第1のレベルの領域と上記第2のレベルの領域との境界を示す境界線を生成する境界線生成部と、
    上記エッジ検出部で検出された各エッジ位置の画素のそれぞれに対応して上記境界線生成部で生成された境界線を連結して、上記静止画像における上記第1のレベルの領域と上記第2のレベルの領域との境界を示すアウトラインを求める連結処理部とを備え
    上記境界線生成部は、
    上記エッジ位置の画素のデータ値と上記周辺に位置する画素のデータ値との差に基づいて上記境界線の角度を検出する境界線角度検出部と、
    上記エッジ位置の画素のデータ値に対応した上記第1のレベルおよび上記第2のレベルの混入率に基づいて、上記境界線角度検出部で検出された角度の境界線の切片を検出する境界線切片検出部とからなり、
    上記画素切り出し部は、
    上記エッジ位置の画素に対して水平方向の左右にそれぞれ隣接する画素d2,d1と、上記エッジ位置の画素に対して垂直方向の上下にそれぞれ隣接する画素d3,d4とを切り出し、
    上記境界線角度検出部は、
    水平方向成分d2−d1および垂直方向成分d4−d3からなる差ベクトルの方向に90度だけ加算した角度を境界線の角度とす
    ことを特徴とするアウトライン作成装置。
  2. 上記連結処理部は、
    上記境界線生成部で生成される上記各エッジ位置の画素に対応した境界線の方向をそれぞれ左側または右側にデータ値の高い画素が存在するように設定し、
    第1の境界線に連結する第2の境界線を、該第1の境界線の終点に最も近い始点を持つ境界線とする
    ことを特徴とする請求項1に記載のアウトライン作成装置。
  3. 静止画像を構成する各画素より第1のレベルと該第1のレベルより大きな第2のレベルとの間のレベルを持つエッジ位置の画素を検出するエッジ検出ステップと、
    上記エッジ検出ステップで検出された各エッジ位置の画素にそれぞれ対応して該エッジ位置の画素および該エッジ位置の画素の周辺に位置する画素を切り出す画素切り出しステップと、
    上記エッジ検出ステップで検出される各エッジ位置の画素のそれぞれに対応して、上記画素切り出しステップで切り出された画素のデータ値に基づき、画素内における上記第1のレベルの領域と上記第2のレベルの領域との境界を示す境界線を生成する境界線生成ステップと、
    上記エッジ検出ステップで検出された各エッジ位置の画素のそれぞれに対応して、上記境界線生成部で生成された境界線を連結して上記静止画像における上記第1のレベルの領域と上記第2のレベルの領域との境界を示すアウトラインを求める連結処理ステップとを備え
    上記境界線生成ステップは、
    上記エッジ位置の画素のデータ値と上記周辺に位置する画素のデータ値との差に基づいて上記境界線の角度を検出する境界線角度検出ステップと、
    上記エッジ位置の画素のデータ値に対応した上記第1のレベルおよび上記第2のレベルの混入率に基づいて、上記境界線角度検出ステップで検出された角度の境界線の切片を検出する境界線切片検出ステップとからなり、
    上記画素切り出しステップでは、
    上記エッジ位置の画素に対して水平方向の左右にそれぞれ隣接する画素d2,d1と、上記エッジ位置の画素に対して垂直方向の上下にそれぞれ隣接する画素d3,d4とを切り出し、
    上記境界線角度検出ステップでは、
    水平方向成分d2−d1および垂直方向成分d4−d3からなる差ベクトルの方向に90度だけ加算した角度を境界線の角度とす
    ことを特徴とするアウトライン作成方法。
  4. 複数の画素データより構成される静止画像データを入力するデータ入力部と、
    上記データ入力部に入力された静止画像データに基づいて、上記静止画像における第1のレベルの領域と該第1のレベルより大きな第2のレベルの領域との境界を示すアウトラインを作成するアウトライン作成部と、
    上記アウトライン作成部で作成されたアウトラインに基づいて、拡大対象の画像領域の画素数を増加して拡大画像用の静止画像データを生成するデータ生成部を有し、
    上記アウトライン作成部は、
    上記静止画像を構成する各画素より上記第1のレベルと上記第2のレベルとの間のレベルを持つエッジ位置の画素を検出するエッジ検出部と、
    上記エッジ検出部で検出された各エッジ位置の画素にそれぞれ対応して該エッジ位置の画素および該エッジ位置の画素の周辺に位置する画素を切り出す画素切り出し部と、
    上記エッジ検出部で検出される各エッジ位置の画素のそれぞれに対応して、上記画素切り出し部で切り出された画素のデータ値に基づき、画素内における上記第1のレベルの領域と上記第2のレベルの領域との境界を示す境界線を生成する境界線生成部と、
    上記エッジ検出部で検出された各エッジ位置の画素のそれぞれに対応して上記境界線生成部で生成された境界線を連結して、上記静止画像における上記第1のレベルの領域と上記第2のレベルの領域との境界を示すアウトラインを求める連結処理部とを備え
    上記境界線生成部は、
    上記エッジ位置の画素のデータ値と上記周辺に位置する画素のデータ値との差に基づいて上記境界線の角度を検出する境界線角度検出部と、
    上記エッジ位置の画素のデータ値に対応した上記第1のレベルおよび上記第2のレベルの混入率に基づいて、上記境界線角度検出部で検出された角度の境界線の切片を検出する境界線切片検出部とからなり、
    上記画素切り出し部は、
    上記エッジ位置の画素に対して水平方向の左右にそれぞれ隣接する画素d2,d1と、上記エッジ位置の画素に対して垂直方向の上下にそれぞれ隣接する画素d3,d4とを切り出し、
    上記境界線角度検出部は、
    水平方向成分d2−d1および垂直方向成分d4−d3からなる差ベクトルの方向に90度だけ加算した角度を境界線の角度とす
    ことを特徴とする画像処理装置。
JP2006146209A 2006-05-26 2006-05-26 アウトラインの作成装置および作成方法、並びに画像処理装置 Expired - Fee Related JP4770590B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2006146209A JP4770590B2 (ja) 2006-05-26 2006-05-26 アウトラインの作成装置および作成方法、並びに画像処理装置
US11/748,868 US7957594B2 (en) 2006-05-26 2007-05-15 Outline definition apparatus and outline definition method, and image processing apparatus
CN2007101045917A CN101079150B (zh) 2006-05-26 2007-05-25 轮廓定义设备和轮廓定义方法、以及图像处理设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006146209A JP4770590B2 (ja) 2006-05-26 2006-05-26 アウトラインの作成装置および作成方法、並びに画像処理装置

Publications (3)

Publication Number Publication Date
JP2007316964A JP2007316964A (ja) 2007-12-06
JP2007316964A5 JP2007316964A5 (ja) 2009-06-25
JP4770590B2 true JP4770590B2 (ja) 2011-09-14

Family

ID=38749579

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006146209A Expired - Fee Related JP4770590B2 (ja) 2006-05-26 2006-05-26 アウトラインの作成装置および作成方法、並びに画像処理装置

Country Status (3)

Country Link
US (1) US7957594B2 (ja)
JP (1) JP4770590B2 (ja)
CN (1) CN101079150B (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102855642B (zh) * 2011-06-28 2018-06-15 富泰华工业(深圳)有限公司 图像处理装置及其物体轮廓的提取方法
US9053389B2 (en) 2012-12-03 2015-06-09 Analog Devices, Inc. Hough transform for circles
CN107103865B (zh) * 2017-04-10 2020-12-15 海信视像科技股份有限公司 检测显示屏中显示区域的方法和装置
US11594028B2 (en) * 2018-05-18 2023-02-28 Stats Llc Video processing for enabling sports highlights generation

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0836641A (ja) 1994-07-25 1996-02-06 Sony Corp エッジ画像データ符号化・復号化方法と装置
JP2001326807A (ja) * 2000-05-17 2001-11-22 Dainippon Screen Mfg Co Ltd 画像処理装置および記録媒体
JP4178875B2 (ja) 2002-08-22 2008-11-12 株式会社ニコン マーク位置検出装置、マーク位置検出方法、重ね合わせ測定装置、および、重ね合わせ測定方法
US7218763B2 (en) * 2003-02-27 2007-05-15 Eastman Kodak Company Method for automated window-level settings for magnetic resonance images

Also Published As

Publication number Publication date
CN101079150B (zh) 2012-03-21
US7957594B2 (en) 2011-06-07
CN101079150A (zh) 2007-11-28
JP2007316964A (ja) 2007-12-06
US20070274594A1 (en) 2007-11-29

Similar Documents

Publication Publication Date Title
CN108960229B (zh) 一种面向多方向的文字检测方法和装置
JP2812982B2 (ja) 表認識方法
JP4770590B2 (ja) アウトラインの作成装置および作成方法、並びに画像処理装置
JPH0320882A (ja) 関心領域抽出方法及び切り出し方法
CN114902280A (zh) 分析装置及分析方法
JP6337680B2 (ja) 画像処理システム、画像処理装置、プログラム及び画像処理方法
JP4760550B2 (ja) 画像変換装置及び画像変換プログラム
JPH06208625A (ja) 画像処理方法及び装置
CN110163829B (zh) 图像生成方法、装置和计算机可读存储介质
JP2858530B2 (ja) エッジ強調装置
US11640535B2 (en) Probability acquisition apparatus and probability acquisition method
JP2000182056A (ja) 画像処理装置
JP2009141525A (ja) 画像処理装置及び画像処理方法
JP2008234455A (ja) テンプレートマッチング装置及び方法
JP2005156206A (ja) 亀裂幅算出方法
JP2666552B2 (ja) アウトライン文字における線幅制御方法
JP2934011B2 (ja) 画像処理方法及び装置
JPH06215183A (ja) 文字認識装置
JPH1049670A (ja) 画像処理方法
JP2011033705A (ja) 画像処理装置および画像処理方法
JP2022122703A (ja) プログラム、情報処理装置、判断方法
CN116758239A (zh) 激光线处理方法、装置、计算机设备和存储介质
JP3089913B2 (ja) 高品質文字出力装置
JPH0876736A (ja) 図形処理装置
JPH03266197A (ja) 文字切出し回路

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090513

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090513

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110404

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110524

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110606

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140701

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140701

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees