JPS5914070A - 画像フアイル方式 - Google Patents

画像フアイル方式

Info

Publication number
JPS5914070A
JPS5914070A JP57123460A JP12346082A JPS5914070A JP S5914070 A JPS5914070 A JP S5914070A JP 57123460 A JP57123460 A JP 57123460A JP 12346082 A JP12346082 A JP 12346082A JP S5914070 A JPS5914070 A JP S5914070A
Authority
JP
Japan
Prior art keywords
image
extracted
halftone
binary
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57123460A
Other languages
English (en)
Inventor
Koichi Ejiri
公一 江尻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP57123460A priority Critical patent/JPS5914070A/ja
Publication of JPS5914070A publication Critical patent/JPS5914070A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/60Memory management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Processing Or Creating Images (AREA)
  • Memory System (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 技術分野 本発明は、文書などの画像情報のファイル方式文書情報
は、一般に第1図に示すようなファイル構造で蓄積して
いる。すなわち、文章部分に相当するコード情報のファ
イルCと、その文書中の写真やグラフなどの画像情報の
ファイルG、に分けて蓄積している。P、はファイルC
1に関連する画像情報ファイルG1のアドレスを示すポ
インタである。
この様なファイル構造では、コード情報ファイルC1に
ついては、項目毎に、あるいは文章単位の区切りを手が
かりとして、コード検索ヤキーワード検索が可能である
。一方、画素の状態で蓄積される画像情報ファイルG、
については、そのような検索方法は不可能であり、予め
人手によって画像情報ファイルG1の分類コードを与え
、対応のコード情報ファイル04等に記録しておく必要
があった。
しかし従来は、画像の属性を表現する形式が確立されて
おらず、「手書きの棒グラフのある文書」とか、[右下
にイラストのある文書]、「中央に写真のある文書」な
どを想起しても、その検索は不可能であった。
目的 本発明の目的は、写真やグラフ等を含む文書等の画像情
報を、検索の容易な形で自動的にファイルする方式を提
供することにある。
概要 不発明によれば、入力画像から中間調画像(写真など)
、2値図形画像(グラフなど)、および文章画像の各領
域が抽出される。抽出された中間調画像と2値図形画像
の各領域について、特定の特徴パラメータが計算される
。この特徴パラメータは具体的には、中間画像領域につ
いては中間調の割合や濃度勾配の頻度分布等であシ、2
値図形画像領域については直線成分の割合、直線の長さ
の分布、線の曲率分布等である。
抽出された中間調画像と2値図形画像の各領域の画像情
報、およびそれらの領域について計算された特徴パラメ
ータ、および、文章画像領域の画像情報は、それぞれ関
連付けて記憶される。
実施例 本発明の一実施例のブロック図を第2図に示す。
同図において、10は公知のOCDイメージスキャナ等
の光電変換手段から成る読取部である。この読取部10
は例えば文書原稿をラスク走査し、文書原稿上の濃淡情
報を画素単位に分解して読み取り、それをアナログの画
像信号として出力する。
このアナログの画像信号はA /′D変換部11におい
て、多値量子化(例えばレベル0〜16の17値)され
、ディジタルの画像データに変換される。これ以降、こ
の多値ディジタル画像データを単に入力画像と称する。
スカ画像は2値化都12によって所定の閾値で2値化さ
れ、またディザ化部13によってディザ化される。この
ディザ化処理は周知であるので詳細は説明しないが、例
えば入力画像が17値であれば、特願昭56−3097
5号の明細書に詳述されているようなディザマトリクス
を用いて実行できる。入力画像の2値化出力およびディ
ザ化出力は、それぞれ中間調画像領域抽出部14へ送ら
れる。
中間調画像領域抽出部14は、入力画像から写真等の中
間調画像領域を抽出するものである。中間調画像領域の
抽出方法は種々提案されている。例えば、多値画像のM
xN画素領域内に存在する中間調濃度レベルの割合を直
接調べ、その割合が多ければそのMXN画素領域が中間
調画像領域に含まれると判定する方法がある。また、デ
ィザ化後の画像の各走査ライン上の白ランレングス分布
から中間調画像領域を抽出する方法がある。
この様な方法を本発明に適用することも勿論可能である
が、本実施例の中間調画像領域抽出部14では、先に特
願昭56−30975号で提案した方法によって、中間
調画像領域を抽出するものとする。
すなわち、ディザ化部13において、ディザマトリクス
の特定の要素で゛′白°°と判定された画素の個数と、
値の大きい順にいくつかのグループに分けられたデイザ
マ) IJクスの要素群毎にそれで°゛黒°′と判定さ
れた画素の個数とを、所定サイズの画像領か判定する0
そして、中間調画像の領域についてはディザ化部13よ
り人力されるディザ化画像をバッファ(B)17に送る
。それ以外の領域については、2値化部12よシ入力さ
れる2値化画像をバッファ(8)16に送る。この様な
処理は前記の特願昭56−30975号明細曹に詳述さ
れているので、これ以上の詳細は割愛する。
特徴パラメータ計算部(A)15は、中間調画像領域抽
出部14で抽出された中間調画像領域の特徴パラメータ
として、中間調の割合、濃度勾配の頻度分布、および中
間調画像領域の入力画像上における位置を計算する部分
である。中間調の割合の求め方は種々考えられるが、本
実施例では、lF!:lii間:3・:画像領域抽出部
14において判定のだめに算出する値(特願昭56−3
0975号明細書中のT)をそのまま利用する。ただし
、このTは判定単位である小さな画像領域毎に算出され
るので、特徴パラメータ計算筒s (A) 15は中間
調画像領域の全体についてTの平均値を算出し、それを
最終的な中間調の割合として出力する。
また特徴−くラメータ計算都15は、中間調画像領域に
ついて濃度勾配の頻度分布を計算する。この特徴パラメ
ータの計算方法も種々考えられるが、本実施例では、A
/D変換部11より出力される多値画像上において、隣
り合う画素間の濃度レベル差を求めることにより、中間
調画像領域内の濃度勾配の頻度分布を得る。
また中間調画像領域の位置は、例えば中間調画像領域抽
出部14で中間調と判定された各画像領域の位置から、
中間調画像領域全体の中心座標を計算し、出力する。な
お、この位置は必ずしも特徴パラメータに含めなくても
よいが、「中央に写真のある文書」というような指定に
よって該当の文書を検索する場合には、位置情報を特徴
パラメータに含める必要がある。
さて、バッファ%)16に一時的に蓄積される内容は、
入力画像中の中間調画像領域以外の領域の画像である。
すなわち、文章画像、あるいは、グラフ等の2値図形画
像の領域の2値化画像情報である。この様なバッファ(
A)i6の内容から2値図形画像領域を抽出するのが、
2値図形画像領域抽出都18である。この抽出処理の方
法は種々考えられるが、本実施例では先に特願昭56−
23940号で提案した方法によって2値図形画像領域
を抽出する。
この抽出方法は、隣接する黒画素を連結し、連結した一
連の黒画素を含む連結画素領域を求め、と扛ら各連結画
素領域をその大きさと相対距離を考慮してさらに大きな
領域に統合するという処理を行なう。そして、文字行と
しては太き過ぎる統合領域を2値図形画像領域として抽
出する。
斯る処理方法の一つの利点として、前記の特願昭56−
23940号明細書の記述より明らかなように、不質的
に、文字行の切り出しも同時に実行できる点がある。つ
まシ、2値図形画像領域抽出部18は、バッファ(A)
16内の画像から2値図形画像領域を抽出してバッファ
(D)21に蓄積する一方、それ以外の領域、即ち、文
章画像領域を抜き出してバッファ(0) 20に送る。
この文章画像領域の画像情報は、一般に、圧縮した形に
してファイルするのが記憶媒体の節約等の観点から好ま
しい。しかして、この様な圧縮を行なうには、文章画像
領域の文字行を切り出しておくと都合が良いからである
特徴パラメータ計算部(B) 19は、2値図形画像領
域抽出部18で抽出される2値図形画像領域について、
直線成分の割合、直線の長さの分布、線の曲率分布、お
よび抽出領域の入力画像上の位置を特徴パラメータとし
て求める。これら特徴パラメータの求め方は種々考えら
れるが、本実施例では次に述べるような方法によって行
なう。
まず、前の2つの特徴パラメータについては、特願昭5
6−181795号で提案した方法によシ、2値図形画
像領域中の所定の長さ以上の横方向、および縦方向の直
線成分を抽出する。そして、抽出した直線成分の長さく
画素数)の分布を計算し、また各直線成分の長さの合計
値を求めて直線成分の割合を計算する。
3つp目の特徴パラメータである線の曲率分布は、例え
ば縦方向と横方向の線を抽出し、それらの曲率を調べる
ことによって求める0その具体的な手法の一例を以下に
述べる。
まず、2値図形画像領域について、各黒画素にその連結
方向にしたがって第3図に示す8つの方向コードを付け
る。いずれの方向コードにも該当しない黒画素には、不
定コード9を付ける。つぎに、これら8方向コードを第
4図の4つの方向コードに統合する操作を行なう。不定
コード9は不定コード5に変換する。そして、4方向コ
ード付は後に、方向コード1と方向コード3について連
結性を調べ、横方向(方向コード1に相当)の線(スト
ローク)と、縦方向(方向コード3に相当:の線を抽出
する。以上の方向コード付け、および縦、横方向の線の
抽出の処理は、特願昭56−83279号明細書に詳し
く述べられているので、ここでは、これ以上は説明しな
い。
以上の様にして抽出した縦、横方向の各線につぃて、そ
の湾曲率を抽出する。この処理は、縦方向の線について
は、横方向(左から右)を主走査方向としてその線の範
囲を上から下へ向ってラスク走査しながら、また横方向
の線については、縦方向(下から上)を主走査方向に選
び、その線の範囲を左から右にラスク走査しながら、第
5図の概略流れ図に示す手順で実行することができる。
この処理手順について説明する。(縦方向の線の場合と
して説明する)。
ステップ100.現走査ライン上の境界画素(線の縁部
の黒画素)が8方向コード(第3図)のうちの2.3.
4(横方向の線の場合は、6.7.8)のいずれかの方
向コードが付けられていれば、その境界画素にR,コー
ドを付ける。方向コードが8方向コード中の6.7.8
(横方向の線の場合は、2.3.4)のいずれかであれ
ば、その境界画素にLコードを付ける。
ステップ101 二現走査ラインとその前の4走査ライ
ン、計5走査ライン上において、Rコードが付けられた
境界画素の数RUPと、Lコードが付けられた境界画素
の数LUPをそれぞれ求める。
ステップ102:RUPとLUPの値の差Cを算出する
ステップ103.前走査ラインと現走査ラインとのCの
値の差ΔCを算出する。
ステップ104.現走査ラインまでのΔCの値の総和Σ
Δ・Cを算出する。
ステップ105 :Σ、tCの絶対値が5以上に達した
か判定し、1ΣΔ−01≧5ならステップ107へ分岐
する。
ステップ106.対象の線の領域の下端(横方向の線の
場合は右端)に達したか判定する。下端(右端)よシ手
前であれば、次の走査ラインについ・、てステップ10
0より実行を再開する。下端(右端)に達していれば、
処理を終了する。この判定で処理を終了する場合は、当
該線の湾曲率は未定であり、曲率分布の計算対象から当
該線を除外する。
ステップ107.線の範囲の」二端(横方向の線の場合
は左端)から現走査ラインまでの走査ライン1Σ1iC
1 数nと1ΣΔclから、湾曲率−□を算出する。
第6図に、縦方向の線のパター/例と、それに対する上
記処理過程における各パラメータの推移を示す。この線
の場合、15走査ラインで1Σ・ΔC1が15以上にな
るので、湾曲率は8/15となる。
特徴パラメータ計算部θ3)19は、以上の手順によっ
て2値図形画像領域内の縦、横方向の各線について湾曲
率を抽出し、その結果を用いてその領域全体の曲率分布
を求めて出力する。
また、2値図形画像領域抽出部】8はある小さな領域の
単位で2値図形画像の領域か否かを判定する。特徴パラ
メータ計算部@19は、2値図形画像領域抽出部18で
2値図形画像と判定された各小領域の位置から、2値図
形画像領域全体の中心位置を求め、それを位置情報とし
て出力する。この位置情報は、中間調画像領域の場合と
同様、必ずしも不可欠なものではない。
さて、バッファの)17.020.021にそれぞれ抽
出される中間調画像、文章画像、2値図形画像の各領域
の画素レベルの画像情報は、そのままの形でファイルし
てもよいが、記憶媒体の有効利用を図る上で、一般に何
等かの形でデータ圧縮するのが好ましい。そこで本実施
例においても、コード化部(+3) 23、(024、
(IJ 2.5を設け、バッファ(1117,020,
021の画像情報を圧縮コードに変換して記憶制御部2
6へ送るようにしている。このデータ圧縮は種々の方式
が可能であるが、これは本発明の要旨では無いので詳細
は説明しない。
またコード化部(A) 22は、特徴パラメータ計算部
(A) 15、(8) 1.9で計算された特徴パラメ
ータを一定の形式の特徴コードに変換して記憶制御部2
6へ送る。
記憶制御部26は、入力画像から抽出された各領域の画
像情報と特徴パラメータとを関連付けて記憶部27に格
納する。この際のファイル構造は輝々考えられる。例え
ば、入力画像を第1図の如き構造でファイルし、その文
章画像のファイルに、同じ入力画像中の中間調画像と2
値図形画像の各ファイルの存在位置を示すポインタと特
徴コードを記録する構造とすることができる。
以上、一実施例について説明したが、本発明はそれに限
定されるものではなく、種々変形して実施できることは
勿論である。また第2図のブロック図は、機能面からブ
ロックを分けて示したものである。したがって、各ブロ
ックは必要に応じて他のブロックと統合したり、あるい
は、更に細分化してもよい。また、第1図のブロックI
3.14.15、I8、I9.26などは、専用のハー
ドウェアとして構成することも勿論可能であるが、汎用
のプロセッサを用いてプログラム処理を利用する構成も
可能であり、この場合はこれら各ブロックは物理的には
1つのブロックに吸収することができる。
効果 以上に詳述した如く、本発明によれば、コード検索やキ
ーワード検索は勿論のこと、従来は不可能であった「棒
グラフのある文書−1とが「写真を含む文書」といった
属性による直接的な検索が可能なファイルを、人手の介
入なしに効率良く自動的に生成することができ、その効
果は極めて大ぎい。
【図面の簡単な説明】
第1図は文書の一般的なファイル構造の説明図、第2図
は本発明の一実施例を示すブロック図、第3図および第
4図は方向コードの説明図、第5図は湾曲率を求める処
理の概略流れ図、第6図は線のパターンの一例とその湾
曲率の抽出過程のパラメータの推移を示す図である。 10・・・読取部、11・・・A/D変換部、I2・・
・2値化部、13・・・ディザ化部、14・・・中間調
画像領域抽出部、15.19・・・特徴パラメータ計算
部、16.17.20,21・・・バッファ、18・・
・2値図形画像領域抽出部、22〜25・・コード化部
、26・・・記憶制御部、27・・・記憶部。 401− ′守 城

Claims (3)

    【特許請求の範囲】
  1. (1)画像を入力する手段と、入力画像から中間調画像
    、2値図形画像、および文章画像の各領域を抽出する手
    段と、抽出された中間調画像と2値図形画像の各領域に
    ついて特定の特徴パラメータを計算する手段と、抽出さ
    れた中間調画像と2値図形画像の各領域の画像情報およ
    びそれら領域に対して計算した特徴パラメータ、および
    、抽出された文章画像領域の画像情報をそれぞれ関連付
    けて記憶する手段とを具備することを特徴とする画像フ
    ァイル方式。
  2. (2)中間調画像領域について計算する特徴パラメータ
    には、中間調の割合および濃度勾配の頻度分布のうちの
    少なくとも1つを含むことを特徴とする特許請求の範囲
    第1項の画像ファイル方式。
  3. (3)2値図形画像領域について計算する特徴パラメー
    タには、直線成分の割合、直線の長さの分布、および線
    の曲率分布のうちの少なくとも1つを含むことを特徴と
    する特許請求の範囲第1項の画像ファイル方式。
JP57123460A 1982-07-15 1982-07-15 画像フアイル方式 Pending JPS5914070A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57123460A JPS5914070A (ja) 1982-07-15 1982-07-15 画像フアイル方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57123460A JPS5914070A (ja) 1982-07-15 1982-07-15 画像フアイル方式

Publications (1)

Publication Number Publication Date
JPS5914070A true JPS5914070A (ja) 1984-01-24

Family

ID=14861172

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57123460A Pending JPS5914070A (ja) 1982-07-15 1982-07-15 画像フアイル方式

Country Status (1)

Country Link
JP (1) JPS5914070A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6175477A (ja) * 1984-09-21 1986-04-17 Hitachi Ltd フアイリング方式
JPS62279467A (ja) * 1986-05-28 1987-12-04 Mitsubishi Electric Corp 画像検索装置
JPH0262678A (ja) * 1988-08-30 1990-03-02 Nec Corp 図面管理装置
JPH02126242U (ja) * 1989-03-24 1990-10-17

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6175477A (ja) * 1984-09-21 1986-04-17 Hitachi Ltd フアイリング方式
JPS62279467A (ja) * 1986-05-28 1987-12-04 Mitsubishi Electric Corp 画像検索装置
JPH0262678A (ja) * 1988-08-30 1990-03-02 Nec Corp 図面管理装置
JPH02126242U (ja) * 1989-03-24 1990-10-17

Similar Documents

Publication Publication Date Title
US7454060B2 (en) Image processor for character recognition
JPH11338976A (ja) 文書画像認識装置、その方法、及び記録媒体
JP2000175053A (ja) 文書の圧縮ピクセルマップ表現を表す混合ラスタコンテントプレ―ンの処理方法
KR920001798B1 (ko) 화상처리장치
JPS5914070A (ja) 画像フアイル方式
JP7301529B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JPH09186858A (ja) 画像処理方法及び装置、及びコンピュータ制御装置
JP4250316B2 (ja) 画像圧縮装置、画像伸長装置、及びその方法並びに記憶媒体
JPH0514703A (ja) 画像処理装置
GB2261340A (en) Image data processing method with mixture of simple binarization and half tone imaging
JPH0140376B2 (ja)
JPH0774966A (ja) 画像処理装置
JPH08221515A (ja) 画像処理装置
JP4129320B2 (ja) 画像処理装置及び記録媒体
KR100214337B1 (ko) 혼재문서의 이치화방법
JP2730775B2 (ja) 画像処理装置
KR101024027B1 (ko) 이진 화상 처리방법 및 장치
JP2009223893A (ja) 画像認識装置、画像認識方法及び画像認識装置を備える画像読取装置
JPH11308438A (ja) 画像処理装置
JPH07175927A (ja) 画像処理装置
JPH03125569A (ja) 画像2値化装置
JP2005210570A (ja) 画像処理装置、画像処理用プログラム及び記憶媒体
JPS6331826B2 (ja)
JPS6214263A (ja) 文書画像処理方式
JP2001184511A (ja) 画像処理装置、画像処理システム、画像処理方法、及び記憶媒体