JPH1049668A - 濃淡値文書画像からの特徴抽出方法及び特徴抽出装置 - Google Patents

濃淡値文書画像からの特徴抽出方法及び特徴抽出装置

Info

Publication number
JPH1049668A
JPH1049668A JP8206268A JP20626896A JPH1049668A JP H1049668 A JPH1049668 A JP H1049668A JP 8206268 A JP8206268 A JP 8206268A JP 20626896 A JP20626896 A JP 20626896A JP H1049668 A JPH1049668 A JP H1049668A
Authority
JP
Japan
Prior art keywords
polygon
extracting
polygons
image
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8206268A
Other languages
English (en)
Other versions
JP3602659B2 (ja
Inventor
Hirofumi Nishida
広文 西田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP20626896A priority Critical patent/JP3602659B2/ja
Priority to US08/896,142 priority patent/US6041138A/en
Publication of JPH1049668A publication Critical patent/JPH1049668A/ja
Application granted granted Critical
Publication of JP3602659B2 publication Critical patent/JP3602659B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/182Extraction of features or characteristics of the image by coding the contour of the pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10008Still image; Photographic image from scanner, fax or copier
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 低解像度の画像においても認識に有効な特徴
を抽出できる濃淡値文書画像からの特徴抽出方法及び特
徴抽出装置を提供することを目的とする。 【解決手段】 文書原稿画像から生成された濃淡値レベ
ルの画像データに対して,濃淡値情報を高さ方向に見立
てて3次元的な曲面データとして解析する。三角形近似
手段104は曲面データを三角形近似し,多角形統合手
段105は隣接し合う近似三角形を多角形に統合し,更
に特徴抽出手段106は,隣接し合う多角形の境界線付
近の特徴を抽出する。また輪郭線抽出手段207は,多
角形と抽出された隣接し合う多角形の境界線付近の特徴
を使って輪郭線特徴を抽出し,更に,該結果に基づき,
抽出された輪郭線を外部・内部輪郭に分類して,ベクト
ル・ラスター変換の手法を用いて2値画像を生成する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は,濃淡値文書画像か
らの特徴抽出方法及び特徴抽出装置における文字,文書
画像等の認識,とりわけ画質の低いもの,画像の解像度
が低い文字,文書画像等の認識のための特徴抽出技術に
係り,特に,スキャナ等の画像読取装置から入力された
濃淡値画像から,2値化を通さずに直接,濃淡値データ
を用いて輪郭線特徴を抽出し,更に,抽出された輪郭線
を用いて入力画像が2値画像を生成する濃淡値文書画像
からの特徴抽出方法及び特徴抽出装置に関する。
【0002】
【従来の技術】従来の文書,文字認識方式では,スキャ
ナ等の画像入力装置から入力された濃淡値の画像データ
に対して,濃淡値をある閾値で2値化することにより得
られる2値画像から,各種の有効な特徴を抽出する方法
が用いられてきている。
【0003】しかしながら,画像入力装置の光学的な作
用,特に,点広がり関数の作用によって,画像入力の際
に画像に様々な歪みが生ずることがWangとPavlidisによ
り指摘されている(L.Wang and T.Pavlidis, "Direct G
ray-Scale Extraction ofFeatures for Character Reco
gnition", IEEE Transactions on PatternAnalysis and
Machine Intelligence, vol.15, no.10, pp.1053-106
7, October1993)。
【0004】このため,機械的な処理で2値化された画
像は,多くの重要な情報を失うことになり,認識におけ
る誤りや拒否が生じる重要な原因となっている。この技
術課題に対し,WangとPavlidisは,認識に有効な特徴の
抽出に置いては,濃淡値画像を曲面と見ることによっ
て,曲面の構造を解析することの重要性を強調してい
る。
【0005】特に,彼らは,微分幾何学的な操作を用い
ることによって,濃淡値曲面から様々な地形的な特徴,
具体的には,濃淡値の局所的最大,最小である尾根線や
谷線,そして,濃淡値がある方向から見ると最大になっ
ているが,それと直行する方向から見れば最小になって
いるような鞍点などを抽出する方法を提案している。
【0006】この方法では,文字のストロークの骨格線
が尾根線に対応するという仮定をおくことによって,濃
淡値画像から,直接,2値画像の細線化で得られるよう
なストロークの骨格線特徴を抽出することを目的として
いる。
【0007】
【発明が解決しようとする課題】しかしながら,この従
来の方法には,幾つかの問題点がある。先ず,既存の文
字認識アルゴリズムでは,ストロークの骨格線を利用す
るものの他に,文字の輪郭線の構造的・統計的特徴を利
用する有効なものが数多くある。WangとPavlidisの方法
は,輪郭線を用いている認識アルゴリズムには向いてお
らず,これまでの輪郭線を使った認識アルゴリズムの貴
重な技術的財産を生かすことができないため,汎用的な
目的には向いていない。
【0008】更に,文字の線幅が十分に細いときには,
尾根線を抽出することが可能であるが,太い線の場合に
は,尾根線の位置を正確に見つけることが難しくなる。
また,尾根,谷,鞍点の検出には,微分操作が必要とな
るが,実際のディジタル画像に微分操作を施すことには
いくつかの困難がある。とりわけ,実装においては,数
値解析における微分方程式の解法と同様に,数多くのパ
ラメータ設定が必要になり,それらのパラメータ調整が
難しいという問題が生じてくる。
【0009】また,エッジ検出,輪郭線抽出等の汎用的
なアルゴリズムは数多く知られているが,文字,文書画
像の場合,特に,もともとの画像が2値で,それが画像
入力の際の光学的影響により濃淡値になっていること,
そして,文字,記号等の文書の構成要素の輪郭は必ず閉
曲線になっていることに注意する必要がある。更に,建
造物の画像,航空写真のエッジ検出のように位置の正確
さは必要とされず,むしろ,認識に有効な形の特徴が維
持されるように輪郭線が抽出されることがより重要であ
る。
【0010】更に,Pavlidis, Chen, Josephは,解像度
と各ピクセルが持つ濃淡値のレベルの数の間にはトレー
ドオフがあり,特に,文章画像においては,解像度が高
ければ,濃淡値レベルは少なくて済むのに対し,解像度
が下がるにつれて,多くの濃淡値レベルが必要になるこ
とを示している(T.Pavlidis, M.Chen, and E.Joseph,
"Sampling and Quantization of Bilevel Signals", P
atten RecognitionLetters, vol.14, no.7, pp.559-56
2, July 1993)。
【0011】また,多くの2値化方式では,ピクセルの
濃淡値の統計的分布をもとにして,閾値を決定するため
に,データの数(空間的密度)が減少する低解像度の画
像においては,統計的推論の精度が下がることが必死で
ある。従って,低解像度の画像においても,認識に有効
な特徴が抽出できるような方式が必要である。
【0012】本発明は,上記従来の問題点に鑑みてなさ
れたものであって,これまでの輪郭線やストロークの骨
格線等を使った認識アルゴリズムの貴重な技術的財産を
生かすために,文書画像から得られた濃淡値画像データ
の汎用的なデータ表現方式,及びデータ構造を提案し,
該データ表現方式をもとに,文字,記号等の輪郭線など
の特徴を抽出するための体系的な濃淡値文書画像からの
特徴抽出方法及び特徴抽出装置を提供することを目的と
している。
【0013】即ち,本発明の目的は,線が太い文字には
有効でないストロークの骨格線特徴ばかりでなく,輪郭
線特徴も抽出でき,獲得した特徴を多くの認識アルゴリ
ズムにおいて使用可能とし,また,輪郭線特徴をもと
に,輪郭線を内部輪郭及び外部輪郭に分類して内部を塗
りつぶして2値画像を生成可能とし,更に,提案するデ
ータ構造を基盤にすることによって,ディジタル画像で
は不安定な微分操作を避け得る濃淡値文書画像からの特
徴抽出方法及び特徴抽出装置を提供することである。
【0014】また,本発明の他の目的は,これまでの文
字認識の研究から,構造的な文字認識方式とパターンマ
ッチング方式の両方において,特に,方向特徴や凹凸特
徴が有効であることが分かっており,成功している文字
認識方式の多くはこれらの特徴を何らかの形で使ってい
るものが多いが,濃淡値画像データの表現方式として方
向特徴と凹凸特徴を用いることにより,文字,記号等の
文書画像構成要素の本質的特徴を生かした特徴抽出を可
能とした濃淡値文書画像からの特徴抽出方法及び特徴抽
出装置を提供することである。
【0015】更に,本発明の他の目的は,低解像度の画
像において認識に有効な特徴を抽出するため,文字等の
本質的な特徴に着目することによりデータ数(空間的密
度)の減少に伴う総情報量を減少させ,総情報量の中の
小さい部分を占める本質的情報を拾い上げることを可能
とした濃淡値文書画像からの特徴抽出方法及び特徴抽出
装置を提供することである。
【0016】
【課題を解決するための手段】上記課題を解決するため
に,本発明の請求項1に係る濃淡値文書画像からの特徴
抽出方法及び特徴抽出装置は,文書原稿画像を読み取っ
て濃淡値レベルの画像データを生成する第1ステップ
と,前記第1ステップにより生成された画像データにつ
いて,濃淡値情報を高さ方向に見立てた3次元的な曲面
データを生成する第2ステップと,前記第2ステップに
より生成された曲面データを三角形近似する第3ステッ
プと,前記第3ステップにより得られた近似三角形の
内,隣接し合う近似三角形を多角形に統合する第4ステ
ップと,前記第4ステップで得られた隣接し合う多角形
の境界付近の特徴を抽出する第5ステップとを具備した
ものである。
【0017】また,請求項2に係る濃淡値文書画像から
の特徴抽出方法は,文書原稿画像を読み取って濃淡値レ
ベルの画像データを生成する第1ステップと,前記第1
ステップにより生成された画像データについて,濃淡値
情報を高さ方向に見立てた3次元的な曲面データを生成
する第2ステップと,前記第2ステップにより生成され
た曲面データを三角形近似する第3ステップと,前記第
3ステップにより得られた近似三角形の内,隣接し合う
近似三角形を多角形に統合する第4ステップと,前記第
4ステップで得られた隣接し合う多角形の境界付近の特
徴を抽出する第5ステップと,前記第4及び第5ステッ
プで得られた多角形と隣接し合う多角形の境界付近の特
徴を使って,文字,記号等の文書画像の構成要素の輪郭
線を抽出する第6ステップとを具備したものである。
【0018】また,請求項3に係る濃淡値文書画像から
の特徴抽出方法は,文書原稿画像を読み取って濃淡値レ
ベルの画像データを生成する第1ステップと,前記第1
ステップにより生成された画像データについて,濃淡値
情報を高さ方向に見立てた3次元的な曲面データを生成
する第2ステップと,前記第2ステップにより生成され
た曲面データを三角形近似する第3ステップと,前記第
3ステップにより得られた近似三角形の内,隣接し合う
近似三角形を多角形に統合する第4ステップと,前記第
4ステップで得られた隣接し合う多角形の境界付近の特
徴を抽出する第5ステップと,前記第4及び第5ステッ
プで得られた多角形と隣接し合う多角形の境界付近の特
徴を使って,文字,記号等の文書画像の構成要素の輪郭
線を抽出する第6ステップと,前記第6ステップで抽出
された輪郭線を内部輪郭及び外部輪郭に分類する第7ス
テップと,ベクトル・ラスター変換の手法を使って,前
記内部輪郭及び外部輪郭に基づく輪郭の内部を塗りつぶ
すことにより2値画像を生成する第8ステップとを具備
したものである。
【0019】また,請求項4に係る濃淡値文書画像から
の特徴抽出装置は,文書原稿画像を読み取って濃淡値レ
ベルの画像データを生成する画像入力手段と,前記画像
入力手段により生成された画像データについて,濃淡値
情報を高さ方向に見立てた3次元的な曲面データを生成
する濃淡値情報生成手段と,前記曲面データを記憶する
記憶手段と,前記記憶手段に記憶されている曲面データ
を三角形近似する三角形近似手段と,隣接し合う近似三
角形を多角形に統合する多角形統合手段と,隣接し合う
多角形の境界付近の特徴を抽出する特徴抽出手段とを具
備したものである。
【0020】また,請求項5に係る濃淡値文書画像から
の特徴抽出装置は,文書原稿画像を読み取って濃淡値レ
ベルの画像データを生成する画像入力手段と,前記画像
入力手段により生成された画像データについて,濃淡値
情報を高さ方向に見立てた3次元的な曲面データを生成
する濃淡値情報生成手段と,前記曲面データを記憶する
記憶手段と,前記記憶手段に記憶されている曲面データ
を三角形近似する三角形近似手段と,隣接し合う近似三
角形を多角形に統合する多角形統合手段と,隣接し合う
多角形の境界付近の特徴を抽出する特徴抽出手段と,多
角形と隣接し合う多角形の境界付近の特徴を使って,文
字,記号等の文書画像の構成要素の輪郭線を抽出する輪
郭線抽出手段とを具備したものである。
【0021】また,請求項6に係る濃淡値文書画像から
の特徴抽出装置は,請求項4または5記載の濃淡値文書
画像からの特徴抽出装置において,前記多角形統合手段
は,前記三角形近似手段において得られた近似三角形に
対して,放線方向を量子化しておくことにより,互いに
隣接し合う近似三角形の内,同じ量子化範囲内にあるも
のを統合することにより多角形を構成し,前記特徴抽出
手段は,濃淡値曲面を前記多角形の集まりとして操作す
るものである。
【0022】また,請求項7に係る濃淡値文書画像から
の特徴抽出装置は,請求項4,5または6記載の濃淡値
文書画像からの特徴抽出装置において,前記特徴抽出手
段は,前記多角形統合手段により構築される多角形に対
して,互いに隣接する多角形の境界線付近を水平な平面
で切断したときにできる,2つの多角形と水平面の交差
曲線の凹凸の特徴と方向の特徴を抽出し,濃淡値曲面を
多角形とそれらの隣接多角形間の凹凸特徴と方向の特徴
として扱うものである。
【0023】また,請求項8に係る濃淡値文書画像から
の特徴抽出装置は,請求項4,5または6記載の濃淡値
文書画像からの特徴抽出装置において,前記特徴抽出手
段は,前記多角形統合手段により構築される多角形に対
して,互いに隣接する多角形の境界線付近を複数の垂直
な平面で切断したときにできる,2つの多角形と垂直面
の交差曲線の凹凸の特徴と方向の特徴を抽出し,濃淡値
曲面を多角形とそれらの隣接多角形間の凹凸特徴と方向
の特徴として扱うものである。
【0024】また,請求項9に係る濃淡値文書画像から
の特徴抽出装置は,請求項5,6,7または8記載の濃
淡値文書画像からの特徴抽出装置において,前記輪郭線
抽出手段は,隣接し合う多角形の境界線から,輪郭線の
部分となっている可能性が高いものを,多角形表現され
た濃淡値曲面の局所的特徴を使って抽出し,グラフ理論
の探索問題を使って,輪郭閉曲線を構成するものであ
る。
【0025】また,請求項10に係る濃淡値文書画像か
らの特徴抽出装置は,請求項5,6,7,8または9記
載の濃淡値文書画像からの特徴抽出装置において,前記
輪郭線抽出手段によって抽出された輪郭線を,多角形境
界線の特徴を用いて内部輪郭と外部輪郭とに分類するも
のである。
【0026】また,請求項11に係る濃淡値文書画像か
らの特徴抽出装置は,請求項5,6,7,8,9または
10記載の濃淡値文書画像からの特徴抽出装置におい
て,前記輪郭線抽出手段によって抽出された輪郭線か
ら,ベクトル・ラスター変換の手法を使って,輪郭の内
部を塗りつぶすことにより2値画像を生成するものであ
る。
【0027】
【発明の実施の形態】以下,本発明の濃淡値文書画像か
らの特徴抽出方法及び特徴抽出装置の概要について,並
びに,本発明の濃淡値文書画像からの特徴抽出方法及び
特徴抽出装置の実施形態について,順に図面を参照して
詳細に説明する。
【0028】〔本発明の濃淡値文書画像からの特徴抽出
方法及び特徴抽出装置の概要〕本発明の請求項1に係る
濃淡値文書画像からの特徴抽出方法では,図3に示す如
く,第1ステップS301で文書原稿画像を読み取って
濃淡値レベルの画像データを生成し,第2ステップS3
02では,第1ステップS301により生成された画像
データについて,濃淡値情報を高さ方向に見立てた3次
元的な曲面データを生成し,第3ステップS303では
第2ステップS302により生成された曲面データを三
角形近似し,第4ステップS304では,第3ステップ
S303により得られた近似三角形の内,隣接し合う近
似三角形を多角形に統合し,更に,第5ステップS30
5では第4ステップS304で得られた隣接し合う多角
形の境界付近の特徴を抽出するようにしている。
【0029】これにより,従来の輪郭線やストロークの
骨格線等を使った認識アルゴリズムの貴重な技術的財産
を生かすことができ,文章画像から得られた濃淡値画像
データの汎用的なデータ表現方式及びデータ構造を実現
でき,該データ表現を用いることにより,輪郭線等の特
徴抽出のための効率の良いアルゴリズムの設計が可能に
なり,更に,実際のディジタル画像では問題が多い微分
操作を避けることができる。
【0030】また,請求項2に係る濃淡値文書画像から
の特徴抽出方法では,図3に示す如く,第1ステップS
301で文書原稿画像を読み取って濃淡値レベルの画像
データを生成し,第2ステップS302では,第1ステ
ップS301により生成された画像データについて,濃
淡値情報を高さ方向に見立てた3次元的な曲面データを
生成し,第3ステップS303では第2ステップS30
2により生成された曲面データを三角形近似し,第4ス
テップS304では,第3ステップS303により得ら
れた近似三角形の内,隣接し合う近似三角形を多角形に
統合し,第5ステップS305では第4ステップS30
4で得られた隣接し合う多角形の境界付近の特徴を抽出
し,更に,第6ステップS306では,第4及び第5ス
テップS304,S305で得られた多角形と隣接し合
う多角形の境界付近の特徴を使って,文字,記号等の文
書画像の構成要素の輪郭線を抽出するようにしている。
【0031】これにより,輪郭線等の特徴抽出のための
効率の良いアルゴリズムの設計が可能になり,実際のデ
ィジタル画像では問題が多い微分操作を避けることがで
きると共に,低解像度の画像においても,認識に有効な
特徴,即ち,文字,記号等の輪郭線特徴を抽出すること
ができる。
【0032】また,請求項3に係る濃淡値文書画像から
の特徴抽出方法では,図3に示す如く,第1ステップS
301で文書原稿画像を読み取って濃淡値レベルの画像
データを生成し,第2ステップS302では,第1ステ
ップS301により生成された画像データについて,濃
淡値情報を高さ方向に見立てた3次元的な曲面データを
生成し,第3ステップS303では第2ステップS30
2により生成された曲面データを三角形近似し,第4ス
テップS304では,第3ステップS303により得ら
れた近似三角形の内,隣接し合う近似三角形を多角形に
統合し,第5ステップS305では第4ステップS30
4で得られた隣接し合う多角形の境界付近の特徴を抽出
し,第6ステップS306では,第4及び第5ステップ
S304,S305で得られた多角形と隣接し合う多角
形の境界付近の特徴を使って,文字,記号等の文書画像
の構成要素の輪郭線を抽出し,第7ステップS307で
は第6ステップS306で抽出された輪郭線を内部輪郭
及び外部輪郭に分類し,更に,第8ステップS308で
は,ベクトル・ラスター変換の手法を使って,前記内部
輪郭及び外部輪郭に基づく輪郭の内部を塗りつぶすこと
により2値画像を生成するようにしている。
【0033】これにより,輪郭線等の特徴抽出のための
効率の良いアルゴリズムの設計が可能になり,実際のデ
ィジタル画像では問題が多い微分操作を避けることがで
きると共に,低解像度の画像においても,認識に有効な
特徴,即ち,文字,記号等の輪郭線特徴を抽出すること
ができ,また同時に,形状の特徴を保持した2値画像を
低解像度の濃淡値画像からも生成することができる。
【0034】また,請求項4に係る濃淡値文書画像から
の特徴抽出装置では,図1に示す如く,画像入力手段1
01により文書原稿画像を読み取って濃淡値レベルの画
像データを生成し,濃淡値情報生成手段102では,画
像入力手段101により生成された画像データについ
て,濃淡値情報を高さ方向に見立てた3次元的な曲面デ
ータを生成して,該曲面データを記憶手段103に記憶
し,三角形近似手段104では,記憶手段103に記憶
されている曲面データを三角形近似し,多角形統合手段
105では隣接し合う近似三角形を多角形に統合し,更
に特徴抽出手段106では,隣接し合う多角形の境界付
近の特徴を抽出するようにしている。
【0035】これにより,従来の輪郭線やストロークの
骨格線等を使った認識アルゴリズムの貴重な技術的財産
を生かすことができ,文章画像から得られた濃淡値画像
データの汎用的なデータ表現方式及びデータ構造を実現
でき,該データ表現を用いることにより,輪郭線等の特
徴抽出のための効率の良いアルゴリズムの設計が可能に
なり,更に,実際のディジタル画像では問題が多い微分
操作を避けることができる。
【0036】また,請求項5に係る濃淡値文書画像から
の特徴抽出装置では,図2に示す如く,画像入力手段1
01により文書原稿画像を読み取って濃淡値レベルの画
像データを生成し,濃淡値情報生成手段102では,画
像入力手段101により生成された画像データについ
て,濃淡値情報を高さ方向に見立てた3次元的な曲面デ
ータを生成して,該曲面データを記憶手段103に記憶
し,三角形近似手段104では,記憶手段103に記憶
されている曲面データを三角形近似し,多角形統合手段
105では隣接し合う近似三角形を多角形に統合し,特
徴抽出手段106では隣接し合う多角形の境界付近の特
徴を抽出し,更に輪郭線抽出手段207では,多角形と
隣接し合う多角形の境界付近の特徴を使って,文字,記
号等の文書画像の構成要素の輪郭線を抽出するようにし
ている。
【0037】これにより,輪郭線等の特徴抽出のための
効率の良いアルゴリズムの設計が可能になり,実際のデ
ィジタル画像では問題が多い微分操作を避けることがで
きると共に,低解像度の画像においても,認識に有効な
特徴,即ち,文字,記号等の輪郭線特徴を抽出すること
ができる。
【0038】また,請求項6に係る濃淡値文書画像から
の特徴抽出装置では,多角形統合手段105は,三角形
近似手段104において得られた近似三角形に対して,
放線方向を量子化しておくことにより,互いに隣接し合
う近似三角形の内,同じ量子化範囲内にあるものを統合
することにより多角形を構成し,特徴抽出手段106で
は,濃淡値曲面を前記多角形の集まりとして操作するよ
うにしている。
【0039】つまり,濃淡画像値データのデータ構造及
び表現方式として方向特徴を使用し,該方向特徴に着目
して濃淡値曲面を同じような放線方向を持つ多角形に分
割することとしているので,文字,記号等の文書画像構
成要素の本質的特徴を生かした特徴抽出が可能となる。
【0040】また,請求項7に係る濃淡値文書画像から
の特徴抽出装置では,特徴抽出手段106は,多角形統
合手段105により構築される多角形に対して,互いに
隣接する多角形の境界線付近を水平な平面で切断したと
きにできる,2つの多角形と水平面の交差曲線の凹凸の
特徴と方向の特徴を抽出し,濃淡値曲面を多角形とそれ
らの隣接多角形間の凹凸特徴と方向の特徴として扱うよ
うにしている。
【0041】つまり,濃淡画像値データのデータ構造及
び表現方式として凹凸特徴と方向特徴を使用し,濃淡値
曲面から方向特徴と共に水平面に沿った局所的な凹凸特
徴を獲得することとしているので,文字,記号等の文書
画像構成要素の本質的特徴を生かした特徴抽出が可能と
なる。また,文字等の図形の本質的な特徴である方向特
徴と凹凸特徴に着目して濃淡値曲面を分割し解析するこ
とにより,コンパクトで表現能力の高いデータ表現を得
ることができる。
【0042】また,請求項8に係る濃淡値文書画像から
の特徴抽出装置では,特徴抽出手段106は,多角形統
合手段105により構築される多角形に対して,互いに
隣接する多角形の境界線付近を複数の垂直な平面で切断
したときにできる,2つの多角形と垂直面の交差曲線の
凹凸の特徴と方向の特徴を抽出し,濃淡値曲面を多角形
とそれらの隣接多角形間の凹凸特徴と方向の特徴として
扱うようにしている。
【0043】つまり,濃淡画像値データのデータ構造及
び表現方式として凹凸特徴と方向特徴を使用し,濃淡値
曲面から方向特徴と共に垂直面に沿った局所的な凹凸特
徴を獲得することとしているので,文字,記号等の文書
画像構成要素の本質的特徴を生かした特徴抽出が可能と
なる。また,文字等の図形の本質的な特徴である方向特
徴と凹凸特徴に着目して濃淡値曲面を分割し解析するこ
とにより,コンパクトで表現能力の高いデータ表現を得
ることができる。
【0044】また,請求項9に係る濃淡値文書画像から
の特徴抽出装置では,輪郭線抽出手段207は,隣接し
合う多角形の境界線から,輪郭線の部分となっている可
能性が高いものを,多角形表現された濃淡値曲面の局所
的特徴を使って抽出し,グラフ理論の探索問題を使っ
て,輪郭閉曲線を構成するようにしている。これによ
り,輪郭線抽出問題をグラフ理論を用いることによって
効率よく解くことができる。
【0045】また,請求項10に係る濃淡値文書画像か
らの特徴抽出装置では,輪郭線抽出手段207によって
抽出された輪郭線を,多角形境界線の特徴を用いて内部
輪郭と外部輪郭とに分類し,更に,請求項11に係る濃
淡値文書画像からの特徴抽出装置では,輪郭線抽出手段
207によって抽出された輪郭線から,ベクトル・ラス
ター変換の手法を使って,輪郭の内部を塗りつぶすこと
により2値画像を生成するようにしている。
【0046】文字等の図形の本質的な特徴である方向特
徴と凹凸特徴に着目したデータ表現をもとにしているの
で,低解像度の画像においても,認識に有効な特徴,即
ち,文字,記号等の輪郭線特徴を抽出することができ,
また同時に,形状の特徴を保持した2値画像を低解像度
の濃淡値画像からも生成することができる。
【0047】〔実施形態〕図2は本発明の実施形態に係
る濃淡値文書画像からの特徴抽出装置の構成図である。
【0048】図2において,本実施形態の濃淡値文書画
像からの特徴抽出装置は,文書原稿画像を読み取って濃
淡値レベルの画像データを生成する画像入力手段101
と,画像入力手段101により生成された画像データに
ついて,濃淡値情報を高さ方向に見立てた3次元的な曲
面データを生成する濃淡値情報生成手段102と,該曲
面データを記憶する記憶手段103と,記憶手段103
に記憶されている曲面データを三角形近似する三角形近
似手段104と,隣接し合う近似三角形を多角形に統合
する多角形統合手段105と,隣接し合う多角形の境界
付近の特徴を抽出する特徴抽出手段106と,多角形と
隣接し合う多角形の境界付近の特徴を使って,文字,記
号等の文書画像の構成要素の輪郭線を抽出する輪郭線抽
出手段207とを備えて構成されている。
【0049】また,図3は,本実施形態の濃淡値文書画
像からの特徴抽出装置における特徴抽出方法を説明する
概略フローチャートである。以下では,本概略フローチ
ャートに従い,図4から図13までの説明図を参照し
て,特徴抽出方法を説明する。
【0050】先ず,第1ステップS301では,画像入
力手段101により文書原稿画像を読み取って濃淡値レ
ベルの画像データを生成し,文書画像を濃淡値画像デー
タとして記憶手段103に記憶する。濃淡値画像データ
は,通常,要素が濃淡値レベルを示す整数であるような
2次元配列として記憶手段103内に記憶されている。
【0051】次に,第2ステップS302では,第1ス
テップS301により生成された画像データについて,
濃淡値情報を高さ方向に見立てた3次元的な曲面データ
を生成する。つまり,濃淡値を高さと見なすことによっ
て,濃淡値画像データを曲面として取り扱うものであ
る。図4に文字の濃淡値画像データの一例を示す。
【0052】次に,第3ステップS303では,第2ス
テップS302により生成された曲面データを三角形近
似する。つまり,曲面の三角形近似アルゴリズムを適用
することによって,濃淡値曲面を三角形に分割するもの
である。
【0053】近似アルゴリズムとしては,例えば,De F
loriani (L. De Floriani, "Apyramidal data structur
e for triangle-based surface description", IEEECom
puter Graphics and Applications, vol.9, pp.67-78,
March 1989)によるものを用いることができる。
【0054】このアルゴリズムは,近似精度を表すパラ
メータを1つ指定し,各分割三角形と近似される曲面と
の高さ方向の最大誤差がこの指定パラメータ以下になる
ように,ドロネー三角形分割を応用して,階層的に曲面
を三角形に分割するものである。図5に,図4の濃淡値
文字画像データに対する三角形分割の例を示す。
【0055】次に,方向特徴と凹凸特徴に着目して,こ
の曲面の三角形近似から様々な特徴を抽出するためのデ
ータ表現方式及びデータ構造を構築する。
【0056】先ず第1段階として,第4ステップS30
4では,第3ステップS303により得られた近似三角
形の内,隣接し合う近似三角形を多角形に統合する。即
ち,方向を量子化して,放線方向が同じ量子化範囲にあ
るような,隣接し合う三角形を多角形に統合するもので
ある。
【0057】先ず,量子化方向コードを設定するため
に,高さ方向にz軸(基底ベクトルe3 )をとり,x,
y軸(基底ベクトルe1 ,e2 ),原点Oをそれぞれ画
像面上にとることにより,正規直交座標系Σ=(O;e
1 ,e2 ,e3 )を定義する。
【0058】ここで,方向の量子化密度を決めるパラメ
ータN(但し,Nは正の偶数)を設定し,3次元空間内
の方向を次のようにして量子化する。
【0059】xy平面上に原点を通るN本の直線Li
(i=0,1,…,N−1)を定義する。図6はN=4
の場合の3次元空間内の方向の量子化を示している。直
線Liに沿った単位ベクトルは{cos(i/Nπ),
sin(i/Nπ)}で与えられる。
【0060】各直線Li (i=0,1,…,N−1)に
対して,xy平面上に垂直で,直線Li を含むような平
面Πi を定義する。この平面をもとにして,原点Oを通
るN個の直線の集合{Lij:j=0,1,…,N−1}
を導入する。ここで,直線Lij(i,j=0,1,…,
N−1)に沿った単位ベクトルは, uij,0= cos(i/Nπ)cos(j/Nπ)e1+
sin(i/Nπ)cos(j/Nπ)e2−sin
(j/Nπ)e3 で与えられる。
【0061】ここで,直線Lijに沿って,単位ベクトル
uij,0と反対方向の単位ベクトルuij,1= −uij,0をと
れば,単位ベクトルuij,0の向きに方向コード(i,
j),uij,1の向きに方向コード(i,N+j)をそれ
ぞれ割り当てることによって,量子化方向コード(p,
d)(但し,p=0,1,…,N−1;d=0,1,
…,2N−1)を規定できる。また,形式的に,水平面
に沿った方向コード(i,0)(但し,i=0,1,
…,N−1)を(N,i)とも表すことにする。
【0062】図7には,パラメータN=4のときの垂直
面Πi と方向コード(1,0),(1,1),…,
(1,7)を,そして,図8には,パラメータN=4の
ときの方向コード(4,0),(4,1),…,(4,
7)をそれぞれ示す。
【0063】更に,近似分割三角形の放線方向を,量子
化方向によって2N2 個の区間に分類する。u=−vで
あるような2つの単位ベクトルu,vを同一方向と見な
すことにすると,各区間D(i,j),i=0,1,
…,2N−1;j=0,1,…,N−1は,方向を規定
する単位ベクトルを用いて次のように定義される。 D(i,j)={(cosθcosφ,sinθcos
φ,−sinφ):i/Nπ<θ<(i+1)/Nπ,
j/Nπ<φ<(j+1)/Nπ}(i=0,1,…,
2N−1;j=0,1,…,N−1)
【0064】定義した量子化方向区間をもとにして,放
線方向が同一の区間に属し,隣接し合う三角形を多角形
に統合してゆく。
【0065】但し,放線方向 (cos(i/Nπ)cosφ,sin(i/Nπ)c
osφ,−sinφ) (i=0,1,…,2N−1,φは任意), または, (cosθcos(j/Nπ),sinθcos(j/
Nπ),−sin(j/Nπ)) ( θは任意,j=0,1,…,N−1)の三角形は,定
義した区間の境界になるので,そのような放線方向を持
つ三角形については,高さ方向に微少な摂動を加えるこ
とによって,放線方向を微調整する。図9に,図5の分
割三角形を統合してできる多角形分割の例を示す。
【0066】次に,第5ステップS305では,第4ス
テップS304で得られた隣接し合う多角形の境界付近
の特徴を抽出する。つまり,分割近似三角形の統合によ
り構築される多角形に対して,互いに隣接する多角形の
境界線付近を水平な平面で切断したときにできる,2つ
の多角形と水平面の交差曲線の凹凸の特徴と方向の特徴
を抽出するものである。
【0067】ここで,2つの隣接する多角形をa,bと
し,これらの2つの多角形a,bと水平面の交差曲線を
C(a,b)とする。図10では,図9における多角形
分割の一部を拡大したときの水平面と多角形の交差曲線
を太線で示す。
【0068】また,多角形a及びbの境界の凹凸特徴を
次のようにして定義する。交差曲線C(a,b)と,多
角形a及びbの境界線との交点をPとし,Pa ,Pb を
交点Pに十分近い,それぞれ多角形a,bの内部にある
交差曲線C(a,b)上の点とする。ベクトルの外積P
Pa ×PPb の符号が負ならば,多角形a及びbの結合
をa→bと表し,正ならば,b→aというように,結合
の凹凸を表す。
【0069】更に,水平直線Li (i=0,1,…,N
−1)に対して,点(x,y,z)の高さ関数 hi (x,y,z)=−xsin(i/Nπ)+yco
s(i/Nπ) の大小関係を3点P,Pa ,Pb について比較すること
により,多角形a及びbの結合の方向特徴を決める。
【0070】もし,高さ関数hi が点Pで最大であれ
ば,多角形a及びbの直線Li 方向の水平面に沿った結
合は,方向コード(i,0)=(N,i)が与えられ,
最小であれば,方向コード(i+N,0)=(N,i+
N)が与えられる。それ以外の場合には,高さ関数hi
が交差曲線C(a,b)に沿って単調変化するので,方
向コードは与えられない。
【0071】各直線Li 方向で計算した方向コードを集
めて順番に並べれば, ((N,j(1) ),(N,j(2) ),…,(N,j(m)
) 但し,mは与えられた方向コードの個数, j(k+1) ≡j(k) +1(mod2N ),k=1,2,…,m
−1 というような数列を作ることができるので,この数列の
最初と最後の要素を使って,多角形a及びbの結合の凹
凸特徴と方向特徴を a−(j(1) ,j(m) )→b と表現することができる。
【0072】図11には,図10に示した5つの多角形
I,…,Vに対して求めた,隣接し合う多角形間の凹凸
特徴と方向特徴を,パラメータN=4の場合について示
す。尚,多角形IIと多角形III ,多角形III と多角形IV
の2組については,方向特徴が与えられない。
【0073】また,水平面の代わりに,垂直面Πi (i
=0,1,…,N−1)を使って上記の操作を行えば,
隣接する多角形の結合について,垂直面Πi に沿った凹
凸・方向特徴を求めることができる。但し,外積,高さ
関数の計算の際には,基底ベクトルe3 がx軸の正の方
向,単位ベクトルuij,0がz軸の正の方向,ベクトルの
外積uij,0×e3 がy軸の正の方向になるような座標系
を用いる。
【0074】ここまでは,文書画像から得られた濃淡値
データについて,濃淡値を高さと見ることによって曲面
として扱い,方向特徴及び凹凸特徴に着目したデータ表
現方式とデータ構造を取り扱ってきた。以下では,この
データ表現方式とデータ構造を用いて,文字等の文書画
像の構成要素の輪郭線特徴の抽出方式について述べる。
【0075】先ず,輪郭線とは,濃淡値曲面の勾配が急
なところを辿ることによってできる閉曲線であり,大局
的に見れば単一平面上にはのっていないような曲線では
あるが,局所的には水平な線分として近似できる。従っ
て,上述した多角形による曲面のデータ表現方式とデー
タ構造において,局所的に共通の交差する水平面を持
ち,勾配が急な多角形の境界線をつなげていって,ある
基準のもとで最良となるような閉曲線を構成すれば,輪
郭線を取り出すことができる。この方式をより具体的に
以下で述べる。
【0076】先ず,多角形a,b(a,bは互いに異な
る多角形)のある境界線B(a,b),及び多角形c,
d(c,dは互いに異なる多角形)のある境界線B
(c,d)(bとcは同一であってもよい)付近で,水
平面に沿った凹凸特徴及び方向特徴が次の何れかの形で
表されているとする。 (1)a−(j0 ,j1 )→b,c−(j2 ,j3 )→d (2)a−(j0 ,j1 )→b,d−(j2 ,j3 )→c (3)b−(j0 ,j1 )→a,c−(j2 ,j3 )→d (4)b−(j0 ,j1 )→a,d−(j2 ,j3 )→c
【0077】更に,bとcが互いに異なる多角形の場
合,bとcを結ぶような多角形のパス (e0 =b,e1 ,…,em-1 ,em =c)(但し,m
≧2) があり,多角形e1 とei+1 (i=1,2,…,m−
1)の境界に対しては,水平面に沿った方向特徴が割り
当てられていないと仮定する。即ち,どの水平線Li に
関しても,多角形ei とei+1 と水平面の交差曲線C
(ei ,ei+1 )に沿って高さ関数hi が単調変化する
と仮定する。
【0078】ここで,多角形の列(a,b,e1 ,…,
em-1 ,c,d)と同時に交差するような水平面が存在
する場合には,上記(1)から(4)の式に現れる4つ
の整数j0 ,j1 ,j2 ,j3の間に,それぞれ,次の
ような関係があることが数学的に証明できる: (イ)j2 −j1 ≡1(mod2N ), (ロ)j3 −j1 ≡N(mod2N ), (ハ)j2 −j0 ≡N(mod2N ), (ニ)j0 −j3 ≡1(mod2N )
【0079】この性質を使えば,多角形の境界線B
(a,b)に対して,共通の交差する水平をもつよう
な,近隣の多角形の境界線を見つけだすことができる。
【0080】更に,このような近隣の境界線が複数見つ
かることがあるが,ある基準を用いて近隣の境界線を制
限することにする。
【0081】今,輪郭線抽出において,局所的に共通の
交差する水平面をもち,勾配が急な多角形の境界線をつ
なげてゆくことを考えているのであるから,候補となっ
ている境界線B(a,b)の近隣の境界線B’の鉛直線
との角度α(B’)と,その境界線B’の高さの中間値
(境界線の最高点と最低点の高さ平均)と,境界線B
(a,b)の高さの中間値の差Δz(B(a,b),
B’)の単調増加関数f(α(B’),Δz(B(a,
b),B’)),例えば, f(α,Δz)=sinα(B’)+cΔz(B(a,
b),B’) (cは定数)とを小さくするものだけを,境界線B
(a,b)の近隣の境界線とすればよい。
【0082】例えば,境界線B(a,b)の近隣の境界
線B’について, f0 ≡minB'f(α(B’),Δz(B(a,b),
B’)) を基準にして,f0 +t(tは正の定数)以内のものだ
けを選ぶといった基準が挙げられる。
【0083】まとめると,すべての隣接多角形の組
(a,b)に対して,多角形の境界線付近の水平面に沿
った凹凸特徴及び方向特徴に基づく性質,そして,境界
線の鉛直線との角度αと,その境界線の高さの中間値と
境界線B(a,b)の高さの中間値の差Δzを用いた評
価関数を使って,その境界線B(a,b)と共通の交差
水平面を持ち,急勾配を持つような近隣の多角形の境界
線を見つけることができる。
【0084】更に,文字等の文書画像の構成要素の輪郭
線を抽出するため,多角形境界線をノードとした重み付
き有向グラフを構築する。
【0085】境界線B(a,b)に対して見つけたそれ
ぞれの近隣境界線βについて,重みを評価関数f(α
(β),Δz(B(a,b),β))の値wとするよう
な,重み付き有向リンクB(a,b)−w→βを設け
る。また,この有向グラフにおいて,境界線B(a,
b)と境界線B(b,a)は別々のノードとして扱う。
図12には,図10及び図11の例に対して,この手続
きの適用結果である重み付き有向グラフを示す。
【0086】次に,第6ステップS306では,第4及
び第5ステップS304,S305で得られた多角形と
隣接し合う多角形の境界付近の特徴を使って,文字,記
号等の文書画像の構成要素の輪郭線を抽出する。つま
り,得られた重み付き有向グラフを使って,文字等の輪
郭線を抽出する。
【0087】先ず,すべての多角形境界線の中から,勾
配が最も急なものを選び出し,それに対応するノードs
を有向グラフから見つける。尚,上述のように,境界線
B(a,b)と境界線B(b,a)は別々のノードとし
て扱っているが,どちらを選んでもよい。
【0088】ノードsを出発点として,各ノードへの最
短経路を求める。全てのノードについて最短経路が求め
られたら,有向グラフにおいて,ノードsと同じ連結成
分に属し,且つ,有向リンクt→sを持つようなノード
tを見つけだす。有向グラフ上でノードsからノードt
への経路を辿ってゆき,画像上では,有向グラフの経路
上のノードに対応する多角形境界線の高さの中間値に対
応する点を結び,最後に有向グラフのノードt,sに対
応する境界線の高さの中間値に対応する点を結べば,閉
じた輪郭線ができる。
【0089】また,このようなノードtが複数あるよう
な場合には,例えば,輪郭線の長さが最大になるような
ものを選べはよい。輪郭線が決まったら,その輪郭線を
構成するノードを有向グラフから除去する。
【0090】更に,除去されたノードに対応する多角形
輪郭線を構成する多角形について,その多角形のすべて
の境界線に対応するノードを有向グラフから除去する。
【0091】そして,更新された有向グラフから,再
び,残った多角形境界線の内,勾配が最も急なものに対
応するノードsを有向グラフから見つけて,新しい輪郭
線が見つからなくなるまで,上記の手続きを繰り返す。
図13には,図9の多角形分割に対して上記手続により
見つかった輪郭線と,外輪郭線を構成する多角形境界線
を示す。
【0092】次に,第7ステップS307では,第6ス
テップS306で抽出された輪郭線を内部輪郭及び外部
輪郭に分類し,更に,第8ステップS308では,ベク
トル・ラスター変換の手法を使って,前記内部輪郭及び
外部輪郭に基づく輪郭の内部を塗りつぶすことにより2
値画像を生成する。
【0093】先ず,各輪郭線を内部輪郭及び外部輪郭の
分類は,次のように容易に行うことができる。即ち,そ
の輪郭線を構成する多角形境界線の最低点のy座標の範
囲が,上記の手続きにより構成される輪郭線のy座標の
範囲を含むならば,輪郭線の外側が,輪郭線よりも低く
なっていることになっているので,その輪郭線は外側輪
郭であることが分かる。また,そうでなければ,内側輪
郭である。
【0094】このように輪郭線を内部輪郭及び外部輪郭
に分類すれば,ベクトル・ラスター変換の手法を使っ
て,輪郭線から2値画像を生成することができる。
【0095】
【発明の効果】以上説明したように,本発明の請求項1
に係る濃淡値文書画像からの特徴抽出方法によれば,第
1ステップで文書原稿画像を読み取って濃淡値レベルの
画像データを生成し,第2ステップでは,第1ステップ
により生成された画像データについて,濃淡値情報を高
さ方向に見立てた3次元的な曲面データを生成し,第3
ステップでは第2ステップにより生成された曲面データ
を三角形近似し,第4ステップでは,第3ステップによ
り得られた近似三角形の内,隣接し合う近似三角形を多
角形に統合し,更に,第5ステップでは第4ステップで
得られた隣接し合う多角形の境界付近の特徴を抽出する
こととしたので,従来の輪郭線やストロークの骨格線等
を使った認識アルゴリズムの貴重な技術的財産を生かす
ことができ,文章画像から得られた濃淡値画像データの
汎用的なデータ表現方式及びデータ構造を実現でき,該
データ表現を用いることにより,輪郭線等の特徴抽出の
ための効率の良いアルゴリズムの設計が可能になり,更
に,実際のディジタル画像では問題が多い微分操作を避
け得る濃淡値文書画像からの特徴抽出方法を提供するこ
とができる。
【0096】また,請求項2に係る濃淡値文書画像から
の特徴抽出方法によれば,第1ステップで文書原稿画像
を読み取って濃淡値レベルの画像データを生成し,第2
ステップでは,第1ステップにより生成された画像デー
タについて,濃淡値情報を高さ方向に見立てた3次元的
な曲面データを生成し,第3ステップでは第2ステップ
により生成された曲面データを三角形近似し,第4ステ
ップでは,第3ステップにより得られた近似三角形の
内,隣接し合う近似三角形を多角形に統合し,第5ステ
ップでは第4ステップで得られた隣接し合う多角形の境
界付近の特徴を抽出し,更に,第6ステップでは,第4
及び第5ステップで得られた多角形と隣接し合う多角形
の境界付近の特徴を使って,文字,記号等の文書画像の
構成要素の輪郭線を抽出することとしたので,輪郭線等
の特徴抽出のための効率の良いアルゴリズムの設計が可
能になり,実際のディジタル画像では問題が多い微分操
作を避けることができると共に,低解像度の画像におい
ても,認識に有効な特徴,即ち,文字,記号等の輪郭線
特徴を抽出し得る濃淡値文書画像からの特徴抽出方法を
提供することができる。
【0097】また,請求項3に係る濃淡値文書画像から
の特徴抽出方法によれば,第1ステップで文書原稿画像
を読み取って濃淡値レベルの画像データを生成し,第2
ステップでは,第1ステップにより生成された画像デー
タについて,濃淡値情報を高さ方向に見立てた3次元的
な曲面データを生成し,第3ステップでは第2ステップ
により生成された曲面データを三角形近似し,第4ステ
ップでは,第3ステップにより得られた近似三角形の
内,隣接し合う近似三角形を多角形に統合し,第5ステ
ップでは第4ステップで得られた隣接し合う多角形の境
界付近の特徴を抽出し,第6ステップでは,第4及び第
5ステップで得られた多角形と隣接し合う多角形の境界
付近の特徴を使って,文字,記号等の文書画像の構成要
素の輪郭線を抽出し,第7ステップでは第6ステップで
抽出された輪郭線を内部輪郭及び外部輪郭に分類し,更
に,第8ステップでは,ベクトル・ラスター変換の手法
を使って,前記内部輪郭及び外部輪郭に基づく輪郭の内
部を塗りつぶすことにより2値画像を生成することとし
たので,輪郭線等の特徴抽出のための効率の良いアルゴ
リズムの設計が可能になり,実際のディジタル画像では
問題が多い微分操作を避けることができると共に,低解
像度の画像においても,認識に有効な特徴,即ち,文
字,記号等の輪郭線特徴を抽出することができ,また同
時に,形状の特徴を保持した2値画像を低解像度の濃淡
値画像からも生成し得る濃淡値文書画像からの特徴抽出
方法を提供することができる。
【0098】また,請求項4に係る濃淡値文書画像から
の特徴抽出装置によれば,画像入力手段により文書原稿
画像を読み取って濃淡値レベルの画像データを生成し,
濃淡値情報生成手段では,画像入力手段により生成され
た画像データについて,濃淡値情報を高さ方向に見立て
た3次元的な曲面データを生成して,該曲面データを記
憶手段に記憶し,三角形近似手段では,記憶手段に記憶
されている曲面データを三角形近似し,多角形統合手段
では隣接し合う近似三角形を多角形に統合し,更に特徴
抽出手段では,隣接し合う多角形の境界付近の特徴を抽
出することとしたので,従来の輪郭線やストロークの骨
格線等を使った認識アルゴリズムの貴重な技術的財産を
生かすことができ,文章画像から得られた濃淡値画像デ
ータの汎用的なデータ表現方式及びデータ構造を実現で
き,該データ表現を用いることにより,輪郭線等の特徴
抽出のための効率の良いアルゴリズムの設計が可能にな
り,更に,実際のディジタル画像では問題が多い微分操
作を避け得る濃淡値文書画像からの特徴抽出装置を提供
することができる。
【0099】また,請求項5に係る濃淡値文書画像から
の特徴抽出装置によれば,画像入力手段により文書原稿
画像を読み取って濃淡値レベルの画像データを生成し,
濃淡値情報生成手段では,画像入力手段により生成され
た画像データについて,濃淡値情報を高さ方向に見立て
た3次元的な曲面データを生成して,該曲面データを記
憶手段に記憶し,三角形近似手段では,記憶手段に記憶
されている曲面データを三角形近似し,多角形統合手段
では隣接し合う近似三角形を多角形に統合し,特徴抽出
手段では隣接し合う多角形の境界付近の特徴を抽出し,
更に輪郭線抽出手段では,多角形と隣接し合う多角形の
境界付近の特徴を使って,文字,記号等の文書画像の構
成要素の輪郭線を抽出することとしたので,輪郭線等の
特徴抽出のための効率の良いアルゴリズムの設計が可能
になり,実際のディジタル画像では問題が多い微分操作
を避けることができると共に,低解像度の画像において
も,認識に有効な特徴,即ち,文字,記号等の輪郭線特
徴を抽出し得る濃淡値文書画像からの特徴抽出装置を提
供することができる。
【0100】また,請求項6に係る濃淡値文書画像から
の特徴抽出装置によれば,多角形統合手段は,三角形近
似手段において得られた近似三角形に対して,放線方向
を量子化しておくことにより,互いに隣接し合う近似三
角形の内,同じ量子化範囲内にあるものを統合すること
により多角形を構成し,特徴抽出手段では,濃淡値曲面
を前記多角形の集まりとして操作することとしたので,
文字,記号等の文書画像構成要素の本質的特徴を生かし
た特徴抽出を行い得る濃淡値文書画像からの特徴抽出装
置を提供することができる。
【0101】また,請求項7に係る濃淡値文書画像から
の特徴抽出装置によれば,特徴抽出手段は,多角形統合
手段により構築される多角形に対して,互いに隣接する
多角形の境界線付近を水平な平面で切断したときにでき
る,2つの多角形と水平面の交差曲線の凹凸の特徴と方
向の特徴を抽出し,濃淡値曲面を多角形とそれらの隣接
多角形間の凹凸特徴と方向の特徴として扱うこととした
ので,文字,記号等の文書画像構成要素の本質的特徴を
生かした特徴抽出が可能となり,文字,記号等の文書画
像構成要素の本質的特徴を生かした特徴抽出を行い得る
濃淡値文書画像からの特徴抽出装置を提供することがで
きる。
【0102】また,請求項8に係る濃淡値文書画像から
の特徴抽出装置によれば,特徴抽出手段は,多角形統合
手段により構築される多角形に対して,互いに隣接する
多角形の境界線付近を複数の垂直な平面で切断したとき
にできる,2つの多角形と垂直面の交差曲線の凹凸の特
徴と方向の特徴を抽出し,濃淡値曲面を多角形とそれら
の隣接多角形間の凹凸特徴と方向の特徴として扱うこと
としたので,文字,記号等の文書画像構成要素の本質的
特徴を生かした特徴抽出が可能となり,文字,記号等の
文書画像構成要素の本質的特徴を生かした特徴抽出を行
い得る濃淡値文書画像からの特徴抽出装置を提供するこ
とができる。
【0103】また,請求項9に係る濃淡値文書画像から
の特徴抽出装置によれば,輪郭線抽出手段は,隣接し合
う多角形の境界線から,輪郭線の部分となっている可能
性が高いものを,多角形表現された濃淡値曲面の局所的
特徴を使って抽出し,グラフ理論の探索問題を使って,
輪郭閉曲線を構成することとしたので,輪郭線抽出問題
をグラフ理論を用いることによって効率よく解くことが
できる。
【0104】また,請求項10に係る濃淡値文書画像か
らの特徴抽出装置によれば,輪郭線抽出手段によって抽
出された輪郭線を,多角形境界線の特徴を用いて内部輪
郭と外部輪郭とに分類し,更に,請求項11に係る濃淡
値文書画像からの特徴抽出装置によれば,輪郭線抽出手
段によって抽出された輪郭線から,ベクトル・ラスター
変換の手法を使って,輪郭の内部を塗りつぶすことによ
り2値画像を生成することとし,文字等の図形の本質的
な特徴である方向特徴と凹凸特徴に着目したデータ表現
をもとにしているので,低解像度の画像においても,認
識に有効な特徴,即ち,文字,記号等の輪郭線特徴を抽
出することができ,また同時に,形状の特徴を保持した
2値画像を低解像度の濃淡値画像からも生成し得る濃淡
値文書画像からの特徴抽出装置を提供することができ
る。
【図面の簡単な説明】
【図1】本発明の原理説明図である。
【図2】本発明の実施形態に係る濃淡値文書画像からの
特徴抽出装置の構成図である。
【図3】本実施形態の濃淡値文書画像からの特徴抽出装
置における特徴抽出方法を説明する概略フローチャート
である。
【図4】文字の濃淡値画像データの一例を説明する説明
図である。
【図5】図4の濃淡値文字画像データに対する三角形分
割の例示する説明図である。
【図6】パラメータN=4の場合の3次元空間内の方向
の量子化を規定する直線群を例示する説明図である。
【図7】パラメータN=4のときの垂直面と垂直面に沿
った方向コードを例示する説明図である。
【図8】パラメータN=4のときの水平面上の方向コー
ドを例示する説明図である。
【図9】図5の分割三角形を統合してできる多角形分割
を例示する説明図である。
【図10】図9における多角形分割の一部を拡大したと
きの水平面と多角形の交差曲線を例示する説明図であ
る。
【図11】図10に示した5つの多角形に対して求めた
隣接し合う多角形間の凹凸特徴と方向特徴を例示する説
明図である。
【図12】図10及び図11の例に対する重み付き有向
グラフを例示する説明図である。
【図13】図9の多角形分割に対して見つかった輪郭線
と外輪郭線を構成する多角形境界線を例示する説明図で
ある。
【符号の説明】
101 画像入力手段 102 濃淡値情報生成手段 103 記憶手段 104 三角形近似手段 105 多角形統合手段 106 特徴抽出手段 207 輪郭線抽出手段

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 文書原稿画像を読み取って濃淡値レベル
    の画像データを生成する第1ステップと,前記第1ステ
    ップにより生成された画像データについて,濃淡値情報
    を高さ方向に見立てた3次元的な曲面データを生成する
    第2ステップと,前記第2ステップにより生成された曲
    面データを三角形近似する第3ステップと,前記第3ス
    テップにより得られた近似三角形の内,隣接し合う近似
    三角形を多角形に統合する第4ステップと,前記第4ス
    テップで得られた隣接し合う多角形の境界付近の特徴を
    抽出する第5ステップと,を有することを特徴とする濃
    淡値文書画像からの特徴抽出方法。
  2. 【請求項2】 文書原稿画像を読み取って濃淡値レベル
    の画像データを生成する第1ステップと,前記第1ステ
    ップにより生成された画像データについて,濃淡値情報
    を高さ方向に見立てた3次元的な曲面データを生成する
    第2ステップと,前記第2ステップにより生成された曲
    面データを三角形近似する第3ステップと,前記第3ス
    テップにより得られた近似三角形の内,隣接し合う近似
    三角形を多角形に統合する第4ステップと,前記第4ス
    テップで得られた隣接し合う多角形の境界付近の特徴を
    抽出する第5ステップと,前記第4及び第5ステップで
    得られた多角形と隣接し合う多角形の境界付近の特徴を
    使って,文字,記号等の文書画像の構成要素の輪郭線を
    抽出する第6ステップと,を有することを特徴とする濃
    淡値文書画像からの特徴抽出方法。
  3. 【請求項3】 文書原稿画像を読み取って濃淡値レベル
    の画像データを生成する第1ステップと,前記第1ステ
    ップにより生成された画像データについて,濃淡値情報
    を高さ方向に見立てた3次元的な曲面データを生成する
    第2ステップと,前記第2ステップにより生成された曲
    面データを三角形近似する第3ステップと,前記第3ス
    テップにより得られた近似三角形の内,隣接し合う近似
    三角形を多角形に統合する第4ステップと,前記第4ス
    テップで得られた隣接し合う多角形の境界付近の特徴を
    抽出する第5ステップと,前記第4及び第5ステップで
    得られた多角形と隣接し合う多角形の境界付近の特徴を
    使って,文字,記号等の文書画像の構成要素の輪郭線を
    抽出する第6ステップと,前記第6ステップで抽出され
    た輪郭線を内部輪郭及び外部輪郭に分類する第7ステッ
    プと,ベクトル・ラスター変換の手法を使って,前記内
    部輪郭及び外部輪郭に基づく輪郭の内部を塗りつぶすこ
    とにより2値画像を生成する第8ステップと,を有する
    ことを特徴とする濃淡値文書画像からの特徴抽出方法。
  4. 【請求項4】 文書原稿画像を読み取って濃淡値レベル
    の画像データを生成する画像入力手段と,前記画像入力
    手段により生成された画像データについて,濃淡値情報
    を高さ方向に見立てた3次元的な曲面データを生成する
    濃淡値情報生成手段と,前記曲面データを記憶する記憶
    手段と,前記記憶手段に記憶されている曲面データを三
    角形近似する三角形近似手段と,隣接し合う近似三角形
    を多角形に統合する多角形統合手段と,隣接し合う多角
    形の境界付近の特徴を抽出する特徴抽出手段と,を有す
    ることを特徴とする濃淡値文書画像からの特徴抽出装
    置。
  5. 【請求項5】 文書原稿画像を読み取って濃淡値レベル
    の画像データを生成する画像入力手段と,前記画像入力
    手段により生成された画像データについて,濃淡値情報
    を高さ方向に見立てた3次元的な曲面データを生成する
    濃淡値情報生成手段と,前記曲面データを記憶する記憶
    手段と,前記記憶手段に記憶されている曲面データを三
    角形近似する三角形近似手段と,隣接し合う近似三角形
    を多角形に統合する多角形統合手段と,隣接し合う多角
    形の境界付近の特徴を抽出する特徴抽出手段と,多角形
    と隣接し合う多角形の境界付近の特徴を使って,文字,
    記号等の文書画像の構成要素の輪郭線を抽出する輪郭線
    抽出手段と,を有することを特徴とする濃淡値文書画像
    からの特徴抽出装置。
  6. 【請求項6】 前記多角形統合手段は,前記三角形近似
    手段において得られた近似三角形に対して,放線方向を
    量子化しておくことにより,互いに隣接し合う近似三角
    形の内,同じ量子化範囲内にあるものを統合することに
    より多角形を構成し,前記特徴抽出手段は,濃淡値曲面
    を前記多角形の集まりとして操作することを特徴とする
    請求項4または5記載の濃淡値文書画像からの特徴抽出
    装置。
  7. 【請求項7】 前記特徴抽出手段は,前記多角形統合手
    段により構築される多角形に対して,互いに隣接する多
    角形の境界線付近を水平な平面で切断したときにでき
    る,2つの多角形と水平面の交差曲線の凹凸の特徴と方
    向の特徴を抽出し,濃淡値曲面を多角形とそれらの隣接
    多角形間の凹凸特徴と方向の特徴として扱うことを特徴
    とする請求項4,5または6記載の濃淡値文書画像から
    の特徴抽出装置。
  8. 【請求項8】 前記特徴抽出手段は,前記多角形統合手
    段により構築される多角形に対して,互いに隣接する多
    角形の境界線付近を複数の垂直な平面で切断したときに
    できる,2つの多角形と垂直面の交差曲線の凹凸の特徴
    と方向の特徴を抽出し,濃淡値曲面を多角形とそれらの
    隣接多角形間の凹凸特徴と方向の特徴として扱うことを
    特徴とする請求項4,5または6記載の濃淡値文書画像
    からの特徴抽出装置。
  9. 【請求項9】 前記輪郭線抽出手段は,隣接し合う多角
    形の境界線から,輪郭線の部分となっている可能性が高
    いものを,多角形表現された濃淡値曲面の局所的特徴を
    使って抽出し,グラフ理論の探索問題を使って,輪郭閉
    曲線を構成することを特徴とする請求項5,6,7また
    は8記載の濃淡値文書画像からの特徴抽出装置。
  10. 【請求項10】 前記輪郭線抽出手段によって抽出され
    た輪郭線を,多角形境界線の特徴を用いて内部輪郭と外
    部輪郭とに分類することを特徴とする請求項5,6,
    7,8または9記載の濃淡値文書画像からの特徴抽出装
    置。
  11. 【請求項11】 前記輪郭線抽出手段によって抽出され
    た輪郭線から,ベクトル・ラスター変換の手法を使っ
    て,輪郭の内部を塗りつぶすことにより2値画像を生成
    することを特徴とする請求項5,6,7,8,9または
    10記載の濃淡値文書画像からの特徴抽出装置。
JP20626896A 1996-08-05 1996-08-05 濃淡値文書画像からの特徴抽出方法及び特徴抽出装置 Expired - Fee Related JP3602659B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP20626896A JP3602659B2 (ja) 1996-08-05 1996-08-05 濃淡値文書画像からの特徴抽出方法及び特徴抽出装置
US08/896,142 US6041138A (en) 1996-08-05 1997-07-17 Method and device for extracting features from gray-scale image and generating boundaries of document elements

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP20626896A JP3602659B2 (ja) 1996-08-05 1996-08-05 濃淡値文書画像からの特徴抽出方法及び特徴抽出装置

Publications (2)

Publication Number Publication Date
JPH1049668A true JPH1049668A (ja) 1998-02-20
JP3602659B2 JP3602659B2 (ja) 2004-12-15

Family

ID=16520523

Family Applications (1)

Application Number Title Priority Date Filing Date
JP20626896A Expired - Fee Related JP3602659B2 (ja) 1996-08-05 1996-08-05 濃淡値文書画像からの特徴抽出方法及び特徴抽出装置

Country Status (2)

Country Link
US (1) US6041138A (ja)
JP (1) JP3602659B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010039662A (ja) * 2008-08-04 2010-02-18 Dainippon Printing Co Ltd 皮革形状データ生成装置、皮革形状データ生成方法及び皮革形状データ生成プログラム

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6690841B2 (en) 1997-07-07 2004-02-10 General Electric Company Method and apparatus for image registration
US6411915B1 (en) * 1998-07-28 2002-06-25 General Electric Company Method and apparatus for calibrating a non-contact range sensor
JP4064023B2 (ja) 1999-07-28 2008-03-19 株式会社リコー デジタル画像中間調処理方法及び装置、並びに、デジタル画像中間調処理プログラムを記録した記録媒体
US6587844B1 (en) * 2000-02-01 2003-07-01 At&T Corp. System and methods for optimizing networks of weighted unweighted directed graphs
GB2366108A (en) * 2000-07-14 2002-02-27 Vhsoft Technologies Company Lt Vectorization of raster images
JP4169522B2 (ja) * 2002-03-22 2008-10-22 株式会社リコー 画像処理装置、画像処理プログラム及びこのプログラムを記憶する記憶媒体
JP4118749B2 (ja) * 2002-09-05 2008-07-16 株式会社リコー 画像処理装置、画像処理プログラムおよび記憶媒体
US7321699B2 (en) * 2002-09-06 2008-01-22 Rytec Corporation Signal intensity range transformation apparatus and method
US6985238B2 (en) * 2002-09-25 2006-01-10 General Electric Company Non-contact measurement system for large airfoils
GB2400780B (en) * 2003-04-17 2006-07-12 Research In Motion Ltd System and method of converting edge record based graphics to polygon based graphics
JP4259949B2 (ja) 2003-08-08 2009-04-30 株式会社リコー 画像作成装置、画像作成プログラムおよび記録媒体

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3466661B2 (ja) * 1993-06-29 2003-11-17 キヤノン株式会社 画像処理装置及びその方法
US5629752A (en) * 1994-10-28 1997-05-13 Fuji Photo Film Co., Ltd. Method of determining an exposure amount using optical recognition of facial features
JP2918465B2 (ja) * 1994-11-14 1999-07-12 大日本スクリーン製造株式会社 画像処理方法
DE4443728C1 (de) * 1994-12-08 1996-04-04 Kronseder Maschf Krones Verfahren zur Bestimmung der Form eines Körpers
KR0181075B1 (ko) * 1996-05-08 1999-04-01 배순훈 적응 윤곽선 부호화 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010039662A (ja) * 2008-08-04 2010-02-18 Dainippon Printing Co Ltd 皮革形状データ生成装置、皮革形状データ生成方法及び皮革形状データ生成プログラム

Also Published As

Publication number Publication date
US6041138A (en) 2000-03-21
JP3602659B2 (ja) 2004-12-15

Similar Documents

Publication Publication Date Title
Lee et al. Semantic segmentation of bridge components based on hierarchical point cloud model
Kim et al. Feature detection of triangular meshes based on tensor voting theory
Sohn et al. Extraction of buildings from high resolution satellite data
Ma et al. Capsule-based networks for road marking extraction and classification from mobile LiDAR point clouds
Khoshelham Extending generalized hough transform to detect 3d objects in laser range data
CN102496034B (zh) 基于直线单词的高空间分辨率遥感图像词袋分类方法
CN112529015A (zh) 一种基于几何解缠的三维点云处理方法、装置及设备
Amini et al. Automatic road-side extraction from large scale imagemaps
JPH05500874A (ja) ディジタル化書類における選択本文の自動抽出のための多角形準拠式方法
Dal Poz et al. Automated extraction of road network from medium-and high-resolution images
CN116797787B (zh) 基于跨模态融合与图神经网络的遥感影像语义分割方法
CN110751154B (zh) 一种基于像素级分割的复杂环境多形状文本检测方法
JP3602659B2 (ja) 濃淡値文書画像からの特徴抽出方法及び特徴抽出装置
EP4174792A1 (en) Method for scene understanding and semantic analysis of objects
JPH07220090A (ja) 物体認識方法
Chiang et al. Training deep learning models for geographic feature recognition from historical maps
Omidalizarandi et al. Segmentation and classification of point clouds from dense aerial image matching
JP2003141567A (ja) 3次元都市モデル生成装置及び3次元都市モデル生成方法
Ramel et al. Automatic reading of handwritten chemical formulas from a structural representation of the image
JPH04275685A (ja) 画像領域識別処理方法
Ramel et al. A structural representation adapted to handwritten symbol recognition
Levashev Segmentation of a point cloud by data on laser scanning intensities
Lipardi et al. Geometric modeling and recognition of elongated regions in aerial images
CN113920055A (zh) 一种缺陷检测方法
Moumoun et al. 3d hierarchical segmentation using the markers for the watershed transformation

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040910

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040921

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040924

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081001

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081001

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091001

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101001

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees