JPH1049668A - 濃淡値文書画像からの特徴抽出方法及び特徴抽出装置 - Google Patents
濃淡値文書画像からの特徴抽出方法及び特徴抽出装置Info
- Publication number
- JPH1049668A JPH1049668A JP8206268A JP20626896A JPH1049668A JP H1049668 A JPH1049668 A JP H1049668A JP 8206268 A JP8206268 A JP 8206268A JP 20626896 A JP20626896 A JP 20626896A JP H1049668 A JPH1049668 A JP H1049668A
- Authority
- JP
- Japan
- Prior art keywords
- polygon
- extracting
- polygons
- image
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/12—Edge-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/182—Extraction of features or characteristics of the image by coding the contour of the pattern
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
- G06T2207/10008—Still image; Photographic image from scanner, fax or copier
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30176—Document
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
を抽出できる濃淡値文書画像からの特徴抽出方法及び特
徴抽出装置を提供することを目的とする。 【解決手段】 文書原稿画像から生成された濃淡値レベ
ルの画像データに対して,濃淡値情報を高さ方向に見立
てて3次元的な曲面データとして解析する。三角形近似
手段104は曲面データを三角形近似し,多角形統合手
段105は隣接し合う近似三角形を多角形に統合し,更
に特徴抽出手段106は,隣接し合う多角形の境界線付
近の特徴を抽出する。また輪郭線抽出手段207は,多
角形と抽出された隣接し合う多角形の境界線付近の特徴
を使って輪郭線特徴を抽出し,更に,該結果に基づき,
抽出された輪郭線を外部・内部輪郭に分類して,ベクト
ル・ラスター変換の手法を用いて2値画像を生成する。
Description
らの特徴抽出方法及び特徴抽出装置における文字,文書
画像等の認識,とりわけ画質の低いもの,画像の解像度
が低い文字,文書画像等の認識のための特徴抽出技術に
係り,特に,スキャナ等の画像読取装置から入力された
濃淡値画像から,2値化を通さずに直接,濃淡値データ
を用いて輪郭線特徴を抽出し,更に,抽出された輪郭線
を用いて入力画像が2値画像を生成する濃淡値文書画像
からの特徴抽出方法及び特徴抽出装置に関する。
ナ等の画像入力装置から入力された濃淡値の画像データ
に対して,濃淡値をある閾値で2値化することにより得
られる2値画像から,各種の有効な特徴を抽出する方法
が用いられてきている。
用,特に,点広がり関数の作用によって,画像入力の際
に画像に様々な歪みが生ずることがWangとPavlidisによ
り指摘されている(L.Wang and T.Pavlidis, "Direct G
ray-Scale Extraction ofFeatures for Character Reco
gnition", IEEE Transactions on PatternAnalysis and
Machine Intelligence, vol.15, no.10, pp.1053-106
7, October1993)。
像は,多くの重要な情報を失うことになり,認識におけ
る誤りや拒否が生じる重要な原因となっている。この技
術課題に対し,WangとPavlidisは,認識に有効な特徴の
抽出に置いては,濃淡値画像を曲面と見ることによっ
て,曲面の構造を解析することの重要性を強調してい
る。
ることによって,濃淡値曲面から様々な地形的な特徴,
具体的には,濃淡値の局所的最大,最小である尾根線や
谷線,そして,濃淡値がある方向から見ると最大になっ
ているが,それと直行する方向から見れば最小になって
いるような鞍点などを抽出する方法を提案している。
が尾根線に対応するという仮定をおくことによって,濃
淡値画像から,直接,2値画像の細線化で得られるよう
なストロークの骨格線特徴を抽出することを目的として
いる。
来の方法には,幾つかの問題点がある。先ず,既存の文
字認識アルゴリズムでは,ストロークの骨格線を利用す
るものの他に,文字の輪郭線の構造的・統計的特徴を利
用する有効なものが数多くある。WangとPavlidisの方法
は,輪郭線を用いている認識アルゴリズムには向いてお
らず,これまでの輪郭線を使った認識アルゴリズムの貴
重な技術的財産を生かすことができないため,汎用的な
目的には向いていない。
尾根線を抽出することが可能であるが,太い線の場合に
は,尾根線の位置を正確に見つけることが難しくなる。
また,尾根,谷,鞍点の検出には,微分操作が必要とな
るが,実際のディジタル画像に微分操作を施すことには
いくつかの困難がある。とりわけ,実装においては,数
値解析における微分方程式の解法と同様に,数多くのパ
ラメータ設定が必要になり,それらのパラメータ調整が
難しいという問題が生じてくる。
なアルゴリズムは数多く知られているが,文字,文書画
像の場合,特に,もともとの画像が2値で,それが画像
入力の際の光学的影響により濃淡値になっていること,
そして,文字,記号等の文書の構成要素の輪郭は必ず閉
曲線になっていることに注意する必要がある。更に,建
造物の画像,航空写真のエッジ検出のように位置の正確
さは必要とされず,むしろ,認識に有効な形の特徴が維
持されるように輪郭線が抽出されることがより重要であ
る。
と各ピクセルが持つ濃淡値のレベルの数の間にはトレー
ドオフがあり,特に,文章画像においては,解像度が高
ければ,濃淡値レベルは少なくて済むのに対し,解像度
が下がるにつれて,多くの濃淡値レベルが必要になるこ
とを示している(T.Pavlidis, M.Chen, and E.Joseph,
"Sampling and Quantization of Bilevel Signals", P
atten RecognitionLetters, vol.14, no.7, pp.559-56
2, July 1993)。
濃淡値の統計的分布をもとにして,閾値を決定するため
に,データの数(空間的密度)が減少する低解像度の画
像においては,統計的推論の精度が下がることが必死で
ある。従って,低解像度の画像においても,認識に有効
な特徴が抽出できるような方式が必要である。
れたものであって,これまでの輪郭線やストロークの骨
格線等を使った認識アルゴリズムの貴重な技術的財産を
生かすために,文書画像から得られた濃淡値画像データ
の汎用的なデータ表現方式,及びデータ構造を提案し,
該データ表現方式をもとに,文字,記号等の輪郭線など
の特徴を抽出するための体系的な濃淡値文書画像からの
特徴抽出方法及び特徴抽出装置を提供することを目的と
している。
有効でないストロークの骨格線特徴ばかりでなく,輪郭
線特徴も抽出でき,獲得した特徴を多くの認識アルゴリ
ズムにおいて使用可能とし,また,輪郭線特徴をもと
に,輪郭線を内部輪郭及び外部輪郭に分類して内部を塗
りつぶして2値画像を生成可能とし,更に,提案するデ
ータ構造を基盤にすることによって,ディジタル画像で
は不安定な微分操作を避け得る濃淡値文書画像からの特
徴抽出方法及び特徴抽出装置を提供することである。
字認識の研究から,構造的な文字認識方式とパターンマ
ッチング方式の両方において,特に,方向特徴や凹凸特
徴が有効であることが分かっており,成功している文字
認識方式の多くはこれらの特徴を何らかの形で使ってい
るものが多いが,濃淡値画像データの表現方式として方
向特徴と凹凸特徴を用いることにより,文字,記号等の
文書画像構成要素の本質的特徴を生かした特徴抽出を可
能とした濃淡値文書画像からの特徴抽出方法及び特徴抽
出装置を提供することである。
像において認識に有効な特徴を抽出するため,文字等の
本質的な特徴に着目することによりデータ数(空間的密
度)の減少に伴う総情報量を減少させ,総情報量の中の
小さい部分を占める本質的情報を拾い上げることを可能
とした濃淡値文書画像からの特徴抽出方法及び特徴抽出
装置を提供することである。
に,本発明の請求項1に係る濃淡値文書画像からの特徴
抽出方法及び特徴抽出装置は,文書原稿画像を読み取っ
て濃淡値レベルの画像データを生成する第1ステップ
と,前記第1ステップにより生成された画像データにつ
いて,濃淡値情報を高さ方向に見立てた3次元的な曲面
データを生成する第2ステップと,前記第2ステップに
より生成された曲面データを三角形近似する第3ステッ
プと,前記第3ステップにより得られた近似三角形の
内,隣接し合う近似三角形を多角形に統合する第4ステ
ップと,前記第4ステップで得られた隣接し合う多角形
の境界付近の特徴を抽出する第5ステップとを具備した
ものである。
の特徴抽出方法は,文書原稿画像を読み取って濃淡値レ
ベルの画像データを生成する第1ステップと,前記第1
ステップにより生成された画像データについて,濃淡値
情報を高さ方向に見立てた3次元的な曲面データを生成
する第2ステップと,前記第2ステップにより生成され
た曲面データを三角形近似する第3ステップと,前記第
3ステップにより得られた近似三角形の内,隣接し合う
近似三角形を多角形に統合する第4ステップと,前記第
4ステップで得られた隣接し合う多角形の境界付近の特
徴を抽出する第5ステップと,前記第4及び第5ステッ
プで得られた多角形と隣接し合う多角形の境界付近の特
徴を使って,文字,記号等の文書画像の構成要素の輪郭
線を抽出する第6ステップとを具備したものである。
の特徴抽出方法は,文書原稿画像を読み取って濃淡値レ
ベルの画像データを生成する第1ステップと,前記第1
ステップにより生成された画像データについて,濃淡値
情報を高さ方向に見立てた3次元的な曲面データを生成
する第2ステップと,前記第2ステップにより生成され
た曲面データを三角形近似する第3ステップと,前記第
3ステップにより得られた近似三角形の内,隣接し合う
近似三角形を多角形に統合する第4ステップと,前記第
4ステップで得られた隣接し合う多角形の境界付近の特
徴を抽出する第5ステップと,前記第4及び第5ステッ
プで得られた多角形と隣接し合う多角形の境界付近の特
徴を使って,文字,記号等の文書画像の構成要素の輪郭
線を抽出する第6ステップと,前記第6ステップで抽出
された輪郭線を内部輪郭及び外部輪郭に分類する第7ス
テップと,ベクトル・ラスター変換の手法を使って,前
記内部輪郭及び外部輪郭に基づく輪郭の内部を塗りつぶ
すことにより2値画像を生成する第8ステップとを具備
したものである。
の特徴抽出装置は,文書原稿画像を読み取って濃淡値レ
ベルの画像データを生成する画像入力手段と,前記画像
入力手段により生成された画像データについて,濃淡値
情報を高さ方向に見立てた3次元的な曲面データを生成
する濃淡値情報生成手段と,前記曲面データを記憶する
記憶手段と,前記記憶手段に記憶されている曲面データ
を三角形近似する三角形近似手段と,隣接し合う近似三
角形を多角形に統合する多角形統合手段と,隣接し合う
多角形の境界付近の特徴を抽出する特徴抽出手段とを具
備したものである。
の特徴抽出装置は,文書原稿画像を読み取って濃淡値レ
ベルの画像データを生成する画像入力手段と,前記画像
入力手段により生成された画像データについて,濃淡値
情報を高さ方向に見立てた3次元的な曲面データを生成
する濃淡値情報生成手段と,前記曲面データを記憶する
記憶手段と,前記記憶手段に記憶されている曲面データ
を三角形近似する三角形近似手段と,隣接し合う近似三
角形を多角形に統合する多角形統合手段と,隣接し合う
多角形の境界付近の特徴を抽出する特徴抽出手段と,多
角形と隣接し合う多角形の境界付近の特徴を使って,文
字,記号等の文書画像の構成要素の輪郭線を抽出する輪
郭線抽出手段とを具備したものである。
の特徴抽出装置は,請求項4または5記載の濃淡値文書
画像からの特徴抽出装置において,前記多角形統合手段
は,前記三角形近似手段において得られた近似三角形に
対して,放線方向を量子化しておくことにより,互いに
隣接し合う近似三角形の内,同じ量子化範囲内にあるも
のを統合することにより多角形を構成し,前記特徴抽出
手段は,濃淡値曲面を前記多角形の集まりとして操作す
るものである。
の特徴抽出装置は,請求項4,5または6記載の濃淡値
文書画像からの特徴抽出装置において,前記特徴抽出手
段は,前記多角形統合手段により構築される多角形に対
して,互いに隣接する多角形の境界線付近を水平な平面
で切断したときにできる,2つの多角形と水平面の交差
曲線の凹凸の特徴と方向の特徴を抽出し,濃淡値曲面を
多角形とそれらの隣接多角形間の凹凸特徴と方向の特徴
として扱うものである。
の特徴抽出装置は,請求項4,5または6記載の濃淡値
文書画像からの特徴抽出装置において,前記特徴抽出手
段は,前記多角形統合手段により構築される多角形に対
して,互いに隣接する多角形の境界線付近を複数の垂直
な平面で切断したときにできる,2つの多角形と垂直面
の交差曲線の凹凸の特徴と方向の特徴を抽出し,濃淡値
曲面を多角形とそれらの隣接多角形間の凹凸特徴と方向
の特徴として扱うものである。
の特徴抽出装置は,請求項5,6,7または8記載の濃
淡値文書画像からの特徴抽出装置において,前記輪郭線
抽出手段は,隣接し合う多角形の境界線から,輪郭線の
部分となっている可能性が高いものを,多角形表現され
た濃淡値曲面の局所的特徴を使って抽出し,グラフ理論
の探索問題を使って,輪郭閉曲線を構成するものであ
る。
らの特徴抽出装置は,請求項5,6,7,8または9記
載の濃淡値文書画像からの特徴抽出装置において,前記
輪郭線抽出手段によって抽出された輪郭線を,多角形境
界線の特徴を用いて内部輪郭と外部輪郭とに分類するも
のである。
らの特徴抽出装置は,請求項5,6,7,8,9または
10記載の濃淡値文書画像からの特徴抽出装置におい
て,前記輪郭線抽出手段によって抽出された輪郭線か
ら,ベクトル・ラスター変換の手法を使って,輪郭の内
部を塗りつぶすことにより2値画像を生成するものであ
る。
らの特徴抽出方法及び特徴抽出装置の概要について,並
びに,本発明の濃淡値文書画像からの特徴抽出方法及び
特徴抽出装置の実施形態について,順に図面を参照して
詳細に説明する。
方法及び特徴抽出装置の概要〕本発明の請求項1に係る
濃淡値文書画像からの特徴抽出方法では,図3に示す如
く,第1ステップS301で文書原稿画像を読み取って
濃淡値レベルの画像データを生成し,第2ステップS3
02では,第1ステップS301により生成された画像
データについて,濃淡値情報を高さ方向に見立てた3次
元的な曲面データを生成し,第3ステップS303では
第2ステップS302により生成された曲面データを三
角形近似し,第4ステップS304では,第3ステップ
S303により得られた近似三角形の内,隣接し合う近
似三角形を多角形に統合し,更に,第5ステップS30
5では第4ステップS304で得られた隣接し合う多角
形の境界付近の特徴を抽出するようにしている。
骨格線等を使った認識アルゴリズムの貴重な技術的財産
を生かすことができ,文章画像から得られた濃淡値画像
データの汎用的なデータ表現方式及びデータ構造を実現
でき,該データ表現を用いることにより,輪郭線等の特
徴抽出のための効率の良いアルゴリズムの設計が可能に
なり,更に,実際のディジタル画像では問題が多い微分
操作を避けることができる。
の特徴抽出方法では,図3に示す如く,第1ステップS
301で文書原稿画像を読み取って濃淡値レベルの画像
データを生成し,第2ステップS302では,第1ステ
ップS301により生成された画像データについて,濃
淡値情報を高さ方向に見立てた3次元的な曲面データを
生成し,第3ステップS303では第2ステップS30
2により生成された曲面データを三角形近似し,第4ス
テップS304では,第3ステップS303により得ら
れた近似三角形の内,隣接し合う近似三角形を多角形に
統合し,第5ステップS305では第4ステップS30
4で得られた隣接し合う多角形の境界付近の特徴を抽出
し,更に,第6ステップS306では,第4及び第5ス
テップS304,S305で得られた多角形と隣接し合
う多角形の境界付近の特徴を使って,文字,記号等の文
書画像の構成要素の輪郭線を抽出するようにしている。
効率の良いアルゴリズムの設計が可能になり,実際のデ
ィジタル画像では問題が多い微分操作を避けることがで
きると共に,低解像度の画像においても,認識に有効な
特徴,即ち,文字,記号等の輪郭線特徴を抽出すること
ができる。
の特徴抽出方法では,図3に示す如く,第1ステップS
301で文書原稿画像を読み取って濃淡値レベルの画像
データを生成し,第2ステップS302では,第1ステ
ップS301により生成された画像データについて,濃
淡値情報を高さ方向に見立てた3次元的な曲面データを
生成し,第3ステップS303では第2ステップS30
2により生成された曲面データを三角形近似し,第4ス
テップS304では,第3ステップS303により得ら
れた近似三角形の内,隣接し合う近似三角形を多角形に
統合し,第5ステップS305では第4ステップS30
4で得られた隣接し合う多角形の境界付近の特徴を抽出
し,第6ステップS306では,第4及び第5ステップ
S304,S305で得られた多角形と隣接し合う多角
形の境界付近の特徴を使って,文字,記号等の文書画像
の構成要素の輪郭線を抽出し,第7ステップS307で
は第6ステップS306で抽出された輪郭線を内部輪郭
及び外部輪郭に分類し,更に,第8ステップS308で
は,ベクトル・ラスター変換の手法を使って,前記内部
輪郭及び外部輪郭に基づく輪郭の内部を塗りつぶすこと
により2値画像を生成するようにしている。
効率の良いアルゴリズムの設計が可能になり,実際のデ
ィジタル画像では問題が多い微分操作を避けることがで
きると共に,低解像度の画像においても,認識に有効な
特徴,即ち,文字,記号等の輪郭線特徴を抽出すること
ができ,また同時に,形状の特徴を保持した2値画像を
低解像度の濃淡値画像からも生成することができる。
の特徴抽出装置では,図1に示す如く,画像入力手段1
01により文書原稿画像を読み取って濃淡値レベルの画
像データを生成し,濃淡値情報生成手段102では,画
像入力手段101により生成された画像データについ
て,濃淡値情報を高さ方向に見立てた3次元的な曲面デ
ータを生成して,該曲面データを記憶手段103に記憶
し,三角形近似手段104では,記憶手段103に記憶
されている曲面データを三角形近似し,多角形統合手段
105では隣接し合う近似三角形を多角形に統合し,更
に特徴抽出手段106では,隣接し合う多角形の境界付
近の特徴を抽出するようにしている。
骨格線等を使った認識アルゴリズムの貴重な技術的財産
を生かすことができ,文章画像から得られた濃淡値画像
データの汎用的なデータ表現方式及びデータ構造を実現
でき,該データ表現を用いることにより,輪郭線等の特
徴抽出のための効率の良いアルゴリズムの設計が可能に
なり,更に,実際のディジタル画像では問題が多い微分
操作を避けることができる。
の特徴抽出装置では,図2に示す如く,画像入力手段1
01により文書原稿画像を読み取って濃淡値レベルの画
像データを生成し,濃淡値情報生成手段102では,画
像入力手段101により生成された画像データについ
て,濃淡値情報を高さ方向に見立てた3次元的な曲面デ
ータを生成して,該曲面データを記憶手段103に記憶
し,三角形近似手段104では,記憶手段103に記憶
されている曲面データを三角形近似し,多角形統合手段
105では隣接し合う近似三角形を多角形に統合し,特
徴抽出手段106では隣接し合う多角形の境界付近の特
徴を抽出し,更に輪郭線抽出手段207では,多角形と
隣接し合う多角形の境界付近の特徴を使って,文字,記
号等の文書画像の構成要素の輪郭線を抽出するようにし
ている。
効率の良いアルゴリズムの設計が可能になり,実際のデ
ィジタル画像では問題が多い微分操作を避けることがで
きると共に,低解像度の画像においても,認識に有効な
特徴,即ち,文字,記号等の輪郭線特徴を抽出すること
ができる。
の特徴抽出装置では,多角形統合手段105は,三角形
近似手段104において得られた近似三角形に対して,
放線方向を量子化しておくことにより,互いに隣接し合
う近似三角形の内,同じ量子化範囲内にあるものを統合
することにより多角形を構成し,特徴抽出手段106で
は,濃淡値曲面を前記多角形の集まりとして操作するよ
うにしている。
び表現方式として方向特徴を使用し,該方向特徴に着目
して濃淡値曲面を同じような放線方向を持つ多角形に分
割することとしているので,文字,記号等の文書画像構
成要素の本質的特徴を生かした特徴抽出が可能となる。
の特徴抽出装置では,特徴抽出手段106は,多角形統
合手段105により構築される多角形に対して,互いに
隣接する多角形の境界線付近を水平な平面で切断したと
きにできる,2つの多角形と水平面の交差曲線の凹凸の
特徴と方向の特徴を抽出し,濃淡値曲面を多角形とそれ
らの隣接多角形間の凹凸特徴と方向の特徴として扱うよ
うにしている。
び表現方式として凹凸特徴と方向特徴を使用し,濃淡値
曲面から方向特徴と共に水平面に沿った局所的な凹凸特
徴を獲得することとしているので,文字,記号等の文書
画像構成要素の本質的特徴を生かした特徴抽出が可能と
なる。また,文字等の図形の本質的な特徴である方向特
徴と凹凸特徴に着目して濃淡値曲面を分割し解析するこ
とにより,コンパクトで表現能力の高いデータ表現を得
ることができる。
の特徴抽出装置では,特徴抽出手段106は,多角形統
合手段105により構築される多角形に対して,互いに
隣接する多角形の境界線付近を複数の垂直な平面で切断
したときにできる,2つの多角形と垂直面の交差曲線の
凹凸の特徴と方向の特徴を抽出し,濃淡値曲面を多角形
とそれらの隣接多角形間の凹凸特徴と方向の特徴として
扱うようにしている。
び表現方式として凹凸特徴と方向特徴を使用し,濃淡値
曲面から方向特徴と共に垂直面に沿った局所的な凹凸特
徴を獲得することとしているので,文字,記号等の文書
画像構成要素の本質的特徴を生かした特徴抽出が可能と
なる。また,文字等の図形の本質的な特徴である方向特
徴と凹凸特徴に着目して濃淡値曲面を分割し解析するこ
とにより,コンパクトで表現能力の高いデータ表現を得
ることができる。
の特徴抽出装置では,輪郭線抽出手段207は,隣接し
合う多角形の境界線から,輪郭線の部分となっている可
能性が高いものを,多角形表現された濃淡値曲面の局所
的特徴を使って抽出し,グラフ理論の探索問題を使っ
て,輪郭閉曲線を構成するようにしている。これによ
り,輪郭線抽出問題をグラフ理論を用いることによって
効率よく解くことができる。
らの特徴抽出装置では,輪郭線抽出手段207によって
抽出された輪郭線を,多角形境界線の特徴を用いて内部
輪郭と外部輪郭とに分類し,更に,請求項11に係る濃
淡値文書画像からの特徴抽出装置では,輪郭線抽出手段
207によって抽出された輪郭線から,ベクトル・ラス
ター変換の手法を使って,輪郭の内部を塗りつぶすこと
により2値画像を生成するようにしている。
徴と凹凸特徴に着目したデータ表現をもとにしているの
で,低解像度の画像においても,認識に有効な特徴,即
ち,文字,記号等の輪郭線特徴を抽出することができ,
また同時に,形状の特徴を保持した2値画像を低解像度
の濃淡値画像からも生成することができる。
る濃淡値文書画像からの特徴抽出装置の構成図である。
像からの特徴抽出装置は,文書原稿画像を読み取って濃
淡値レベルの画像データを生成する画像入力手段101
と,画像入力手段101により生成された画像データに
ついて,濃淡値情報を高さ方向に見立てた3次元的な曲
面データを生成する濃淡値情報生成手段102と,該曲
面データを記憶する記憶手段103と,記憶手段103
に記憶されている曲面データを三角形近似する三角形近
似手段104と,隣接し合う近似三角形を多角形に統合
する多角形統合手段105と,隣接し合う多角形の境界
付近の特徴を抽出する特徴抽出手段106と,多角形と
隣接し合う多角形の境界付近の特徴を使って,文字,記
号等の文書画像の構成要素の輪郭線を抽出する輪郭線抽
出手段207とを備えて構成されている。
像からの特徴抽出装置における特徴抽出方法を説明する
概略フローチャートである。以下では,本概略フローチ
ャートに従い,図4から図13までの説明図を参照し
て,特徴抽出方法を説明する。
力手段101により文書原稿画像を読み取って濃淡値レ
ベルの画像データを生成し,文書画像を濃淡値画像デー
タとして記憶手段103に記憶する。濃淡値画像データ
は,通常,要素が濃淡値レベルを示す整数であるような
2次元配列として記憶手段103内に記憶されている。
テップS301により生成された画像データについて,
濃淡値情報を高さ方向に見立てた3次元的な曲面データ
を生成する。つまり,濃淡値を高さと見なすことによっ
て,濃淡値画像データを曲面として取り扱うものであ
る。図4に文字の濃淡値画像データの一例を示す。
テップS302により生成された曲面データを三角形近
似する。つまり,曲面の三角形近似アルゴリズムを適用
することによって,濃淡値曲面を三角形に分割するもの
である。
loriani (L. De Floriani, "Apyramidal data structur
e for triangle-based surface description", IEEECom
puter Graphics and Applications, vol.9, pp.67-78,
March 1989)によるものを用いることができる。
メータを1つ指定し,各分割三角形と近似される曲面と
の高さ方向の最大誤差がこの指定パラメータ以下になる
ように,ドロネー三角形分割を応用して,階層的に曲面
を三角形に分割するものである。図5に,図4の濃淡値
文字画像データに対する三角形分割の例を示す。
の曲面の三角形近似から様々な特徴を抽出するためのデ
ータ表現方式及びデータ構造を構築する。
4では,第3ステップS303により得られた近似三角
形の内,隣接し合う近似三角形を多角形に統合する。即
ち,方向を量子化して,放線方向が同じ量子化範囲にあ
るような,隣接し合う三角形を多角形に統合するもので
ある。
に,高さ方向にz軸(基底ベクトルe3 )をとり,x,
y軸(基底ベクトルe1 ,e2 ),原点Oをそれぞれ画
像面上にとることにより,正規直交座標系Σ=(O;e
1 ,e2 ,e3 )を定義する。
ータN(但し,Nは正の偶数)を設定し,3次元空間内
の方向を次のようにして量子化する。
(i=0,1,…,N−1)を定義する。図6はN=4
の場合の3次元空間内の方向の量子化を示している。直
線Liに沿った単位ベクトルは{cos(i/Nπ),
sin(i/Nπ)}で与えられる。
対して,xy平面上に垂直で,直線Li を含むような平
面Πi を定義する。この平面をもとにして,原点Oを通
るN個の直線の集合{Lij:j=0,1,…,N−1}
を導入する。ここで,直線Lij(i,j=0,1,…,
N−1)に沿った単位ベクトルは, uij,0= cos(i/Nπ)cos(j/Nπ)e1+
sin(i/Nπ)cos(j/Nπ)e2−sin
(j/Nπ)e3 で与えられる。
uij,0と反対方向の単位ベクトルuij,1= −uij,0をと
れば,単位ベクトルuij,0の向きに方向コード(i,
j),uij,1の向きに方向コード(i,N+j)をそれ
ぞれ割り当てることによって,量子化方向コード(p,
d)(但し,p=0,1,…,N−1;d=0,1,
…,2N−1)を規定できる。また,形式的に,水平面
に沿った方向コード(i,0)(但し,i=0,1,
…,N−1)を(N,i)とも表すことにする。
面Πi と方向コード(1,0),(1,1),…,
(1,7)を,そして,図8には,パラメータN=4の
ときの方向コード(4,0),(4,1),…,(4,
7)をそれぞれ示す。
化方向によって2N2 個の区間に分類する。u=−vで
あるような2つの単位ベクトルu,vを同一方向と見な
すことにすると,各区間D(i,j),i=0,1,
…,2N−1;j=0,1,…,N−1は,方向を規定
する単位ベクトルを用いて次のように定義される。 D(i,j)={(cosθcosφ,sinθcos
φ,−sinφ):i/Nπ<θ<(i+1)/Nπ,
j/Nπ<φ<(j+1)/Nπ}(i=0,1,…,
2N−1;j=0,1,…,N−1)
線方向が同一の区間に属し,隣接し合う三角形を多角形
に統合してゆく。
osφ,−sinφ) (i=0,1,…,2N−1,φは任意), または, (cosθcos(j/Nπ),sinθcos(j/
Nπ),−sin(j/Nπ)) ( θは任意,j=0,1,…,N−1)の三角形は,定
義した区間の境界になるので,そのような放線方向を持
つ三角形については,高さ方向に微少な摂動を加えるこ
とによって,放線方向を微調整する。図9に,図5の分
割三角形を統合してできる多角形分割の例を示す。
テップS304で得られた隣接し合う多角形の境界付近
の特徴を抽出する。つまり,分割近似三角形の統合によ
り構築される多角形に対して,互いに隣接する多角形の
境界線付近を水平な平面で切断したときにできる,2つ
の多角形と水平面の交差曲線の凹凸の特徴と方向の特徴
を抽出するものである。
し,これらの2つの多角形a,bと水平面の交差曲線を
C(a,b)とする。図10では,図9における多角形
分割の一部を拡大したときの水平面と多角形の交差曲線
を太線で示す。
次のようにして定義する。交差曲線C(a,b)と,多
角形a及びbの境界線との交点をPとし,Pa ,Pb を
交点Pに十分近い,それぞれ多角形a,bの内部にある
交差曲線C(a,b)上の点とする。ベクトルの外積P
Pa ×PPb の符号が負ならば,多角形a及びbの結合
をa→bと表し,正ならば,b→aというように,結合
の凹凸を表す。
−1)に対して,点(x,y,z)の高さ関数 hi (x,y,z)=−xsin(i/Nπ)+yco
s(i/Nπ) の大小関係を3点P,Pa ,Pb について比較すること
により,多角形a及びbの結合の方向特徴を決める。
ば,多角形a及びbの直線Li 方向の水平面に沿った結
合は,方向コード(i,0)=(N,i)が与えられ,
最小であれば,方向コード(i+N,0)=(N,i+
N)が与えられる。それ以外の場合には,高さ関数hi
が交差曲線C(a,b)に沿って単調変化するので,方
向コードは与えられない。
めて順番に並べれば, ((N,j(1) ),(N,j(2) ),…,(N,j(m)
) 但し,mは与えられた方向コードの個数, j(k+1) ≡j(k) +1(mod2N ),k=1,2,…,m
−1 というような数列を作ることができるので,この数列の
最初と最後の要素を使って,多角形a及びbの結合の凹
凸特徴と方向特徴を a−(j(1) ,j(m) )→b と表現することができる。
I,…,Vに対して求めた,隣接し合う多角形間の凹凸
特徴と方向特徴を,パラメータN=4の場合について示
す。尚,多角形IIと多角形III ,多角形III と多角形IV
の2組については,方向特徴が与えられない。
=0,1,…,N−1)を使って上記の操作を行えば,
隣接する多角形の結合について,垂直面Πi に沿った凹
凸・方向特徴を求めることができる。但し,外積,高さ
関数の計算の際には,基底ベクトルe3 がx軸の正の方
向,単位ベクトルuij,0がz軸の正の方向,ベクトルの
外積uij,0×e3 がy軸の正の方向になるような座標系
を用いる。
データについて,濃淡値を高さと見ることによって曲面
として扱い,方向特徴及び凹凸特徴に着目したデータ表
現方式とデータ構造を取り扱ってきた。以下では,この
データ表現方式とデータ構造を用いて,文字等の文書画
像の構成要素の輪郭線特徴の抽出方式について述べる。
なところを辿ることによってできる閉曲線であり,大局
的に見れば単一平面上にはのっていないような曲線では
あるが,局所的には水平な線分として近似できる。従っ
て,上述した多角形による曲面のデータ表現方式とデー
タ構造において,局所的に共通の交差する水平面を持
ち,勾配が急な多角形の境界線をつなげていって,ある
基準のもとで最良となるような閉曲線を構成すれば,輪
郭線を取り出すことができる。この方式をより具体的に
以下で述べる。
る多角形)のある境界線B(a,b),及び多角形c,
d(c,dは互いに異なる多角形)のある境界線B
(c,d)(bとcは同一であってもよい)付近で,水
平面に沿った凹凸特徴及び方向特徴が次の何れかの形で
表されているとする。 (1)a−(j0 ,j1 )→b,c−(j2 ,j3 )→d (2)a−(j0 ,j1 )→b,d−(j2 ,j3 )→c (3)b−(j0 ,j1 )→a,c−(j2 ,j3 )→d (4)b−(j0 ,j1 )→a,d−(j2 ,j3 )→c
合,bとcを結ぶような多角形のパス (e0 =b,e1 ,…,em-1 ,em =c)(但し,m
≧2) があり,多角形e1 とei+1 (i=1,2,…,m−
1)の境界に対しては,水平面に沿った方向特徴が割り
当てられていないと仮定する。即ち,どの水平線Li に
関しても,多角形ei とei+1 と水平面の交差曲線C
(ei ,ei+1 )に沿って高さ関数hi が単調変化する
と仮定する。
em-1 ,c,d)と同時に交差するような水平面が存在
する場合には,上記(1)から(4)の式に現れる4つ
の整数j0 ,j1 ,j2 ,j3の間に,それぞれ,次の
ような関係があることが数学的に証明できる: (イ)j2 −j1 ≡1(mod2N ), (ロ)j3 −j1 ≡N(mod2N ), (ハ)j2 −j0 ≡N(mod2N ), (ニ)j0 −j3 ≡1(mod2N )
(a,b)に対して,共通の交差する水平をもつよう
な,近隣の多角形の境界線を見つけだすことができる。
かることがあるが,ある基準を用いて近隣の境界線を制
限することにする。
交差する水平面をもち,勾配が急な多角形の境界線をつ
なげてゆくことを考えているのであるから,候補となっ
ている境界線B(a,b)の近隣の境界線B’の鉛直線
との角度α(B’)と,その境界線B’の高さの中間値
(境界線の最高点と最低点の高さ平均)と,境界線B
(a,b)の高さの中間値の差Δz(B(a,b),
B’)の単調増加関数f(α(B’),Δz(B(a,
b),B’)),例えば, f(α,Δz)=sinα(B’)+cΔz(B(a,
b),B’) (cは定数)とを小さくするものだけを,境界線B
(a,b)の近隣の境界線とすればよい。
線B’について, f0 ≡minB'f(α(B’),Δz(B(a,b),
B’)) を基準にして,f0 +t(tは正の定数)以内のものだ
けを選ぶといった基準が挙げられる。
(a,b)に対して,多角形の境界線付近の水平面に沿
った凹凸特徴及び方向特徴に基づく性質,そして,境界
線の鉛直線との角度αと,その境界線の高さの中間値と
境界線B(a,b)の高さの中間値の差Δzを用いた評
価関数を使って,その境界線B(a,b)と共通の交差
水平面を持ち,急勾配を持つような近隣の多角形の境界
線を見つけることができる。
線を抽出するため,多角形境界線をノードとした重み付
き有向グラフを構築する。
ぞれの近隣境界線βについて,重みを評価関数f(α
(β),Δz(B(a,b),β))の値wとするよう
な,重み付き有向リンクB(a,b)−w→βを設け
る。また,この有向グラフにおいて,境界線B(a,
b)と境界線B(b,a)は別々のノードとして扱う。
図12には,図10及び図11の例に対して,この手続
きの適用結果である重み付き有向グラフを示す。
び第5ステップS304,S305で得られた多角形と
隣接し合う多角形の境界付近の特徴を使って,文字,記
号等の文書画像の構成要素の輪郭線を抽出する。つま
り,得られた重み付き有向グラフを使って,文字等の輪
郭線を抽出する。
配が最も急なものを選び出し,それに対応するノードs
を有向グラフから見つける。尚,上述のように,境界線
B(a,b)と境界線B(b,a)は別々のノードとし
て扱っているが,どちらを選んでもよい。
短経路を求める。全てのノードについて最短経路が求め
られたら,有向グラフにおいて,ノードsと同じ連結成
分に属し,且つ,有向リンクt→sを持つようなノード
tを見つけだす。有向グラフ上でノードsからノードt
への経路を辿ってゆき,画像上では,有向グラフの経路
上のノードに対応する多角形境界線の高さの中間値に対
応する点を結び,最後に有向グラフのノードt,sに対
応する境界線の高さの中間値に対応する点を結べば,閉
じた輪郭線ができる。
な場合には,例えば,輪郭線の長さが最大になるような
ものを選べはよい。輪郭線が決まったら,その輪郭線を
構成するノードを有向グラフから除去する。
輪郭線を構成する多角形について,その多角形のすべて
の境界線に対応するノードを有向グラフから除去する。
び,残った多角形境界線の内,勾配が最も急なものに対
応するノードsを有向グラフから見つけて,新しい輪郭
線が見つからなくなるまで,上記の手続きを繰り返す。
図13には,図9の多角形分割に対して上記手続により
見つかった輪郭線と,外輪郭線を構成する多角形境界線
を示す。
テップS306で抽出された輪郭線を内部輪郭及び外部
輪郭に分類し,更に,第8ステップS308では,ベク
トル・ラスター変換の手法を使って,前記内部輪郭及び
外部輪郭に基づく輪郭の内部を塗りつぶすことにより2
値画像を生成する。
分類は,次のように容易に行うことができる。即ち,そ
の輪郭線を構成する多角形境界線の最低点のy座標の範
囲が,上記の手続きにより構成される輪郭線のy座標の
範囲を含むならば,輪郭線の外側が,輪郭線よりも低く
なっていることになっているので,その輪郭線は外側輪
郭であることが分かる。また,そうでなければ,内側輪
郭である。
に分類すれば,ベクトル・ラスター変換の手法を使っ
て,輪郭線から2値画像を生成することができる。
に係る濃淡値文書画像からの特徴抽出方法によれば,第
1ステップで文書原稿画像を読み取って濃淡値レベルの
画像データを生成し,第2ステップでは,第1ステップ
により生成された画像データについて,濃淡値情報を高
さ方向に見立てた3次元的な曲面データを生成し,第3
ステップでは第2ステップにより生成された曲面データ
を三角形近似し,第4ステップでは,第3ステップによ
り得られた近似三角形の内,隣接し合う近似三角形を多
角形に統合し,更に,第5ステップでは第4ステップで
得られた隣接し合う多角形の境界付近の特徴を抽出する
こととしたので,従来の輪郭線やストロークの骨格線等
を使った認識アルゴリズムの貴重な技術的財産を生かす
ことができ,文章画像から得られた濃淡値画像データの
汎用的なデータ表現方式及びデータ構造を実現でき,該
データ表現を用いることにより,輪郭線等の特徴抽出の
ための効率の良いアルゴリズムの設計が可能になり,更
に,実際のディジタル画像では問題が多い微分操作を避
け得る濃淡値文書画像からの特徴抽出方法を提供するこ
とができる。
の特徴抽出方法によれば,第1ステップで文書原稿画像
を読み取って濃淡値レベルの画像データを生成し,第2
ステップでは,第1ステップにより生成された画像デー
タについて,濃淡値情報を高さ方向に見立てた3次元的
な曲面データを生成し,第3ステップでは第2ステップ
により生成された曲面データを三角形近似し,第4ステ
ップでは,第3ステップにより得られた近似三角形の
内,隣接し合う近似三角形を多角形に統合し,第5ステ
ップでは第4ステップで得られた隣接し合う多角形の境
界付近の特徴を抽出し,更に,第6ステップでは,第4
及び第5ステップで得られた多角形と隣接し合う多角形
の境界付近の特徴を使って,文字,記号等の文書画像の
構成要素の輪郭線を抽出することとしたので,輪郭線等
の特徴抽出のための効率の良いアルゴリズムの設計が可
能になり,実際のディジタル画像では問題が多い微分操
作を避けることができると共に,低解像度の画像におい
ても,認識に有効な特徴,即ち,文字,記号等の輪郭線
特徴を抽出し得る濃淡値文書画像からの特徴抽出方法を
提供することができる。
の特徴抽出方法によれば,第1ステップで文書原稿画像
を読み取って濃淡値レベルの画像データを生成し,第2
ステップでは,第1ステップにより生成された画像デー
タについて,濃淡値情報を高さ方向に見立てた3次元的
な曲面データを生成し,第3ステップでは第2ステップ
により生成された曲面データを三角形近似し,第4ステ
ップでは,第3ステップにより得られた近似三角形の
内,隣接し合う近似三角形を多角形に統合し,第5ステ
ップでは第4ステップで得られた隣接し合う多角形の境
界付近の特徴を抽出し,第6ステップでは,第4及び第
5ステップで得られた多角形と隣接し合う多角形の境界
付近の特徴を使って,文字,記号等の文書画像の構成要
素の輪郭線を抽出し,第7ステップでは第6ステップで
抽出された輪郭線を内部輪郭及び外部輪郭に分類し,更
に,第8ステップでは,ベクトル・ラスター変換の手法
を使って,前記内部輪郭及び外部輪郭に基づく輪郭の内
部を塗りつぶすことにより2値画像を生成することとし
たので,輪郭線等の特徴抽出のための効率の良いアルゴ
リズムの設計が可能になり,実際のディジタル画像では
問題が多い微分操作を避けることができると共に,低解
像度の画像においても,認識に有効な特徴,即ち,文
字,記号等の輪郭線特徴を抽出することができ,また同
時に,形状の特徴を保持した2値画像を低解像度の濃淡
値画像からも生成し得る濃淡値文書画像からの特徴抽出
方法を提供することができる。
の特徴抽出装置によれば,画像入力手段により文書原稿
画像を読み取って濃淡値レベルの画像データを生成し,
濃淡値情報生成手段では,画像入力手段により生成され
た画像データについて,濃淡値情報を高さ方向に見立て
た3次元的な曲面データを生成して,該曲面データを記
憶手段に記憶し,三角形近似手段では,記憶手段に記憶
されている曲面データを三角形近似し,多角形統合手段
では隣接し合う近似三角形を多角形に統合し,更に特徴
抽出手段では,隣接し合う多角形の境界付近の特徴を抽
出することとしたので,従来の輪郭線やストロークの骨
格線等を使った認識アルゴリズムの貴重な技術的財産を
生かすことができ,文章画像から得られた濃淡値画像デ
ータの汎用的なデータ表現方式及びデータ構造を実現で
き,該データ表現を用いることにより,輪郭線等の特徴
抽出のための効率の良いアルゴリズムの設計が可能にな
り,更に,実際のディジタル画像では問題が多い微分操
作を避け得る濃淡値文書画像からの特徴抽出装置を提供
することができる。
の特徴抽出装置によれば,画像入力手段により文書原稿
画像を読み取って濃淡値レベルの画像データを生成し,
濃淡値情報生成手段では,画像入力手段により生成され
た画像データについて,濃淡値情報を高さ方向に見立て
た3次元的な曲面データを生成して,該曲面データを記
憶手段に記憶し,三角形近似手段では,記憶手段に記憶
されている曲面データを三角形近似し,多角形統合手段
では隣接し合う近似三角形を多角形に統合し,特徴抽出
手段では隣接し合う多角形の境界付近の特徴を抽出し,
更に輪郭線抽出手段では,多角形と隣接し合う多角形の
境界付近の特徴を使って,文字,記号等の文書画像の構
成要素の輪郭線を抽出することとしたので,輪郭線等の
特徴抽出のための効率の良いアルゴリズムの設計が可能
になり,実際のディジタル画像では問題が多い微分操作
を避けることができると共に,低解像度の画像において
も,認識に有効な特徴,即ち,文字,記号等の輪郭線特
徴を抽出し得る濃淡値文書画像からの特徴抽出装置を提
供することができる。
の特徴抽出装置によれば,多角形統合手段は,三角形近
似手段において得られた近似三角形に対して,放線方向
を量子化しておくことにより,互いに隣接し合う近似三
角形の内,同じ量子化範囲内にあるものを統合すること
により多角形を構成し,特徴抽出手段では,濃淡値曲面
を前記多角形の集まりとして操作することとしたので,
文字,記号等の文書画像構成要素の本質的特徴を生かし
た特徴抽出を行い得る濃淡値文書画像からの特徴抽出装
置を提供することができる。
の特徴抽出装置によれば,特徴抽出手段は,多角形統合
手段により構築される多角形に対して,互いに隣接する
多角形の境界線付近を水平な平面で切断したときにでき
る,2つの多角形と水平面の交差曲線の凹凸の特徴と方
向の特徴を抽出し,濃淡値曲面を多角形とそれらの隣接
多角形間の凹凸特徴と方向の特徴として扱うこととした
ので,文字,記号等の文書画像構成要素の本質的特徴を
生かした特徴抽出が可能となり,文字,記号等の文書画
像構成要素の本質的特徴を生かした特徴抽出を行い得る
濃淡値文書画像からの特徴抽出装置を提供することがで
きる。
の特徴抽出装置によれば,特徴抽出手段は,多角形統合
手段により構築される多角形に対して,互いに隣接する
多角形の境界線付近を複数の垂直な平面で切断したとき
にできる,2つの多角形と垂直面の交差曲線の凹凸の特
徴と方向の特徴を抽出し,濃淡値曲面を多角形とそれら
の隣接多角形間の凹凸特徴と方向の特徴として扱うこと
としたので,文字,記号等の文書画像構成要素の本質的
特徴を生かした特徴抽出が可能となり,文字,記号等の
文書画像構成要素の本質的特徴を生かした特徴抽出を行
い得る濃淡値文書画像からの特徴抽出装置を提供するこ
とができる。
の特徴抽出装置によれば,輪郭線抽出手段は,隣接し合
う多角形の境界線から,輪郭線の部分となっている可能
性が高いものを,多角形表現された濃淡値曲面の局所的
特徴を使って抽出し,グラフ理論の探索問題を使って,
輪郭閉曲線を構成することとしたので,輪郭線抽出問題
をグラフ理論を用いることによって効率よく解くことが
できる。
らの特徴抽出装置によれば,輪郭線抽出手段によって抽
出された輪郭線を,多角形境界線の特徴を用いて内部輪
郭と外部輪郭とに分類し,更に,請求項11に係る濃淡
値文書画像からの特徴抽出装置によれば,輪郭線抽出手
段によって抽出された輪郭線から,ベクトル・ラスター
変換の手法を使って,輪郭の内部を塗りつぶすことによ
り2値画像を生成することとし,文字等の図形の本質的
な特徴である方向特徴と凹凸特徴に着目したデータ表現
をもとにしているので,低解像度の画像においても,認
識に有効な特徴,即ち,文字,記号等の輪郭線特徴を抽
出することができ,また同時に,形状の特徴を保持した
2値画像を低解像度の濃淡値画像からも生成し得る濃淡
値文書画像からの特徴抽出装置を提供することができ
る。
特徴抽出装置の構成図である。
置における特徴抽出方法を説明する概略フローチャート
である。
図である。
割の例示する説明図である。
の量子化を規定する直線群を例示する説明図である。
った方向コードを例示する説明図である。
ドを例示する説明図である。
を例示する説明図である。
きの水平面と多角形の交差曲線を例示する説明図であ
る。
隣接し合う多角形間の凹凸特徴と方向特徴を例示する説
明図である。
グラフを例示する説明図である。
と外輪郭線を構成する多角形境界線を例示する説明図で
ある。
Claims (11)
- 【請求項1】 文書原稿画像を読み取って濃淡値レベル
の画像データを生成する第1ステップと,前記第1ステ
ップにより生成された画像データについて,濃淡値情報
を高さ方向に見立てた3次元的な曲面データを生成する
第2ステップと,前記第2ステップにより生成された曲
面データを三角形近似する第3ステップと,前記第3ス
テップにより得られた近似三角形の内,隣接し合う近似
三角形を多角形に統合する第4ステップと,前記第4ス
テップで得られた隣接し合う多角形の境界付近の特徴を
抽出する第5ステップと,を有することを特徴とする濃
淡値文書画像からの特徴抽出方法。 - 【請求項2】 文書原稿画像を読み取って濃淡値レベル
の画像データを生成する第1ステップと,前記第1ステ
ップにより生成された画像データについて,濃淡値情報
を高さ方向に見立てた3次元的な曲面データを生成する
第2ステップと,前記第2ステップにより生成された曲
面データを三角形近似する第3ステップと,前記第3ス
テップにより得られた近似三角形の内,隣接し合う近似
三角形を多角形に統合する第4ステップと,前記第4ス
テップで得られた隣接し合う多角形の境界付近の特徴を
抽出する第5ステップと,前記第4及び第5ステップで
得られた多角形と隣接し合う多角形の境界付近の特徴を
使って,文字,記号等の文書画像の構成要素の輪郭線を
抽出する第6ステップと,を有することを特徴とする濃
淡値文書画像からの特徴抽出方法。 - 【請求項3】 文書原稿画像を読み取って濃淡値レベル
の画像データを生成する第1ステップと,前記第1ステ
ップにより生成された画像データについて,濃淡値情報
を高さ方向に見立てた3次元的な曲面データを生成する
第2ステップと,前記第2ステップにより生成された曲
面データを三角形近似する第3ステップと,前記第3ス
テップにより得られた近似三角形の内,隣接し合う近似
三角形を多角形に統合する第4ステップと,前記第4ス
テップで得られた隣接し合う多角形の境界付近の特徴を
抽出する第5ステップと,前記第4及び第5ステップで
得られた多角形と隣接し合う多角形の境界付近の特徴を
使って,文字,記号等の文書画像の構成要素の輪郭線を
抽出する第6ステップと,前記第6ステップで抽出され
た輪郭線を内部輪郭及び外部輪郭に分類する第7ステッ
プと,ベクトル・ラスター変換の手法を使って,前記内
部輪郭及び外部輪郭に基づく輪郭の内部を塗りつぶすこ
とにより2値画像を生成する第8ステップと,を有する
ことを特徴とする濃淡値文書画像からの特徴抽出方法。 - 【請求項4】 文書原稿画像を読み取って濃淡値レベル
の画像データを生成する画像入力手段と,前記画像入力
手段により生成された画像データについて,濃淡値情報
を高さ方向に見立てた3次元的な曲面データを生成する
濃淡値情報生成手段と,前記曲面データを記憶する記憶
手段と,前記記憶手段に記憶されている曲面データを三
角形近似する三角形近似手段と,隣接し合う近似三角形
を多角形に統合する多角形統合手段と,隣接し合う多角
形の境界付近の特徴を抽出する特徴抽出手段と,を有す
ることを特徴とする濃淡値文書画像からの特徴抽出装
置。 - 【請求項5】 文書原稿画像を読み取って濃淡値レベル
の画像データを生成する画像入力手段と,前記画像入力
手段により生成された画像データについて,濃淡値情報
を高さ方向に見立てた3次元的な曲面データを生成する
濃淡値情報生成手段と,前記曲面データを記憶する記憶
手段と,前記記憶手段に記憶されている曲面データを三
角形近似する三角形近似手段と,隣接し合う近似三角形
を多角形に統合する多角形統合手段と,隣接し合う多角
形の境界付近の特徴を抽出する特徴抽出手段と,多角形
と隣接し合う多角形の境界付近の特徴を使って,文字,
記号等の文書画像の構成要素の輪郭線を抽出する輪郭線
抽出手段と,を有することを特徴とする濃淡値文書画像
からの特徴抽出装置。 - 【請求項6】 前記多角形統合手段は,前記三角形近似
手段において得られた近似三角形に対して,放線方向を
量子化しておくことにより,互いに隣接し合う近似三角
形の内,同じ量子化範囲内にあるものを統合することに
より多角形を構成し,前記特徴抽出手段は,濃淡値曲面
を前記多角形の集まりとして操作することを特徴とする
請求項4または5記載の濃淡値文書画像からの特徴抽出
装置。 - 【請求項7】 前記特徴抽出手段は,前記多角形統合手
段により構築される多角形に対して,互いに隣接する多
角形の境界線付近を水平な平面で切断したときにでき
る,2つの多角形と水平面の交差曲線の凹凸の特徴と方
向の特徴を抽出し,濃淡値曲面を多角形とそれらの隣接
多角形間の凹凸特徴と方向の特徴として扱うことを特徴
とする請求項4,5または6記載の濃淡値文書画像から
の特徴抽出装置。 - 【請求項8】 前記特徴抽出手段は,前記多角形統合手
段により構築される多角形に対して,互いに隣接する多
角形の境界線付近を複数の垂直な平面で切断したときに
できる,2つの多角形と垂直面の交差曲線の凹凸の特徴
と方向の特徴を抽出し,濃淡値曲面を多角形とそれらの
隣接多角形間の凹凸特徴と方向の特徴として扱うことを
特徴とする請求項4,5または6記載の濃淡値文書画像
からの特徴抽出装置。 - 【請求項9】 前記輪郭線抽出手段は,隣接し合う多角
形の境界線から,輪郭線の部分となっている可能性が高
いものを,多角形表現された濃淡値曲面の局所的特徴を
使って抽出し,グラフ理論の探索問題を使って,輪郭閉
曲線を構成することを特徴とする請求項5,6,7また
は8記載の濃淡値文書画像からの特徴抽出装置。 - 【請求項10】 前記輪郭線抽出手段によって抽出され
た輪郭線を,多角形境界線の特徴を用いて内部輪郭と外
部輪郭とに分類することを特徴とする請求項5,6,
7,8または9記載の濃淡値文書画像からの特徴抽出装
置。 - 【請求項11】 前記輪郭線抽出手段によって抽出され
た輪郭線から,ベクトル・ラスター変換の手法を使っ
て,輪郭の内部を塗りつぶすことにより2値画像を生成
することを特徴とする請求項5,6,7,8,9または
10記載の濃淡値文書画像からの特徴抽出装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP20626896A JP3602659B2 (ja) | 1996-08-05 | 1996-08-05 | 濃淡値文書画像からの特徴抽出方法及び特徴抽出装置 |
US08/896,142 US6041138A (en) | 1996-08-05 | 1997-07-17 | Method and device for extracting features from gray-scale image and generating boundaries of document elements |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP20626896A JP3602659B2 (ja) | 1996-08-05 | 1996-08-05 | 濃淡値文書画像からの特徴抽出方法及び特徴抽出装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH1049668A true JPH1049668A (ja) | 1998-02-20 |
JP3602659B2 JP3602659B2 (ja) | 2004-12-15 |
Family
ID=16520523
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP20626896A Expired - Fee Related JP3602659B2 (ja) | 1996-08-05 | 1996-08-05 | 濃淡値文書画像からの特徴抽出方法及び特徴抽出装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6041138A (ja) |
JP (1) | JP3602659B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010039662A (ja) * | 2008-08-04 | 2010-02-18 | Dainippon Printing Co Ltd | 皮革形状データ生成装置、皮革形状データ生成方法及び皮革形状データ生成プログラム |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6690841B2 (en) | 1997-07-07 | 2004-02-10 | General Electric Company | Method and apparatus for image registration |
US6411915B1 (en) * | 1998-07-28 | 2002-06-25 | General Electric Company | Method and apparatus for calibrating a non-contact range sensor |
JP4064023B2 (ja) | 1999-07-28 | 2008-03-19 | 株式会社リコー | デジタル画像中間調処理方法及び装置、並びに、デジタル画像中間調処理プログラムを記録した記録媒体 |
US6587844B1 (en) * | 2000-02-01 | 2003-07-01 | At&T Corp. | System and methods for optimizing networks of weighted unweighted directed graphs |
GB2366108A (en) * | 2000-07-14 | 2002-02-27 | Vhsoft Technologies Company Lt | Vectorization of raster images |
JP4169522B2 (ja) * | 2002-03-22 | 2008-10-22 | 株式会社リコー | 画像処理装置、画像処理プログラム及びこのプログラムを記憶する記憶媒体 |
JP4118749B2 (ja) * | 2002-09-05 | 2008-07-16 | 株式会社リコー | 画像処理装置、画像処理プログラムおよび記憶媒体 |
US7321699B2 (en) * | 2002-09-06 | 2008-01-22 | Rytec Corporation | Signal intensity range transformation apparatus and method |
US6985238B2 (en) * | 2002-09-25 | 2006-01-10 | General Electric Company | Non-contact measurement system for large airfoils |
GB2400780B (en) * | 2003-04-17 | 2006-07-12 | Research In Motion Ltd | System and method of converting edge record based graphics to polygon based graphics |
JP4259949B2 (ja) | 2003-08-08 | 2009-04-30 | 株式会社リコー | 画像作成装置、画像作成プログラムおよび記録媒体 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3466661B2 (ja) * | 1993-06-29 | 2003-11-17 | キヤノン株式会社 | 画像処理装置及びその方法 |
US5629752A (en) * | 1994-10-28 | 1997-05-13 | Fuji Photo Film Co., Ltd. | Method of determining an exposure amount using optical recognition of facial features |
JP2918465B2 (ja) * | 1994-11-14 | 1999-07-12 | 大日本スクリーン製造株式会社 | 画像処理方法 |
DE4443728C1 (de) * | 1994-12-08 | 1996-04-04 | Kronseder Maschf Krones | Verfahren zur Bestimmung der Form eines Körpers |
KR0181075B1 (ko) * | 1996-05-08 | 1999-04-01 | 배순훈 | 적응 윤곽선 부호화 방법 |
-
1996
- 1996-08-05 JP JP20626896A patent/JP3602659B2/ja not_active Expired - Fee Related
-
1997
- 1997-07-17 US US08/896,142 patent/US6041138A/en not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010039662A (ja) * | 2008-08-04 | 2010-02-18 | Dainippon Printing Co Ltd | 皮革形状データ生成装置、皮革形状データ生成方法及び皮革形状データ生成プログラム |
Also Published As
Publication number | Publication date |
---|---|
US6041138A (en) | 2000-03-21 |
JP3602659B2 (ja) | 2004-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lee et al. | Semantic segmentation of bridge components based on hierarchical point cloud model | |
Kim et al. | Feature detection of triangular meshes based on tensor voting theory | |
Sohn et al. | Extraction of buildings from high resolution satellite data | |
Ma et al. | Capsule-based networks for road marking extraction and classification from mobile LiDAR point clouds | |
Khoshelham | Extending generalized hough transform to detect 3d objects in laser range data | |
CN102496034B (zh) | 基于直线单词的高空间分辨率遥感图像词袋分类方法 | |
CN112529015A (zh) | 一种基于几何解缠的三维点云处理方法、装置及设备 | |
Amini et al. | Automatic road-side extraction from large scale imagemaps | |
JPH05500874A (ja) | ディジタル化書類における選択本文の自動抽出のための多角形準拠式方法 | |
Dal Poz et al. | Automated extraction of road network from medium-and high-resolution images | |
CN116797787B (zh) | 基于跨模态融合与图神经网络的遥感影像语义分割方法 | |
CN110751154B (zh) | 一种基于像素级分割的复杂环境多形状文本检测方法 | |
JP3602659B2 (ja) | 濃淡値文書画像からの特徴抽出方法及び特徴抽出装置 | |
EP4174792A1 (en) | Method for scene understanding and semantic analysis of objects | |
JPH07220090A (ja) | 物体認識方法 | |
Chiang et al. | Training deep learning models for geographic feature recognition from historical maps | |
Omidalizarandi et al. | Segmentation and classification of point clouds from dense aerial image matching | |
JP2003141567A (ja) | 3次元都市モデル生成装置及び3次元都市モデル生成方法 | |
Ramel et al. | Automatic reading of handwritten chemical formulas from a structural representation of the image | |
JPH04275685A (ja) | 画像領域識別処理方法 | |
Ramel et al. | A structural representation adapted to handwritten symbol recognition | |
Levashev | Segmentation of a point cloud by data on laser scanning intensities | |
Lipardi et al. | Geometric modeling and recognition of elongated regions in aerial images | |
CN113920055A (zh) | 一种缺陷检测方法 | |
Moumoun et al. | 3d hierarchical segmentation using the markers for the watershed transformation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040910 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040921 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040924 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081001 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081001 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091001 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101001 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |