JPS6120908B2 - - Google Patents

Info

Publication number
JPS6120908B2
JPS6120908B2 JP56024570A JP2457081A JPS6120908B2 JP S6120908 B2 JPS6120908 B2 JP S6120908B2 JP 56024570 A JP56024570 A JP 56024570A JP 2457081 A JP2457081 A JP 2457081A JP S6120908 B2 JPS6120908 B2 JP S6120908B2
Authority
JP
Japan
Prior art keywords
information
image
search
area
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP56024570A
Other languages
English (en)
Other versions
JPS57139866A (en
Inventor
Toshuki Sakai
Juichi Oota
Yosha Mori
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP56024570A priority Critical patent/JPS57139866A/ja
Publication of JPS57139866A publication Critical patent/JPS57139866A/ja
Publication of JPS6120908B2 publication Critical patent/JPS6120908B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】 この発明は、画像フアイルの蓄積と、その蓄積
を利用する蓄積検索装置に関するものである。
従来この分野では画像の構造化情報を用いない
場合には、全画像パターンを蓄積するか、あるい
OCRにしばしば用いられているように、画像パ
ターンを特定化しコードとして処理をすることが
行われていた。又、画像の構造化情報を用いる場
合には、人手によつて人為的に構造を与えてフア
イルを作成することが行われていた。従つて、前
者では記憶容量が膨大になるか、或は、画像パタ
ーンが限定されるという欠点があり、又後者では
検索フアイルを作成するにあたつて多大の人手と
時間を要するという欠点があつた。
この発明は、上記のような従来のものの欠点を
除去する為になされたもので、画像の蓄積、検索
において、画像の構造・意味を利用することによ
り所要画像フアイルを自動的に作成すること、お
よび検索することを可能ならしめる装置を提供す
ることを目的としている。
以下本発明の構成を1実施例である名刺画像の
蓄積・検索装置について説明する。この実施例で
は名刺画像中の個々の文字枠領域のみを画像パタ
ーンとして蓄積し検索のキーとして指定された姓
名、会社名等の文字パターン列との特徴パラメー
ターマツチングにより目的とする名刺画像を検索
するものである。
第1図は本装置を実現する為の構成図である。
第1図に於いて1は画像を入力する画像入力装置
でこの画像入力装置1は例えば名刺画像を2値化
する入力部分でフアクシミリ等が使用される。2
は構造に係る知識情報を用いて画像の情報領域の
切り出し、構造化を行なう構造化抽出部、3は検
索時に検索のキーと照合する為にインデツクスと
して用いられる特徴パラメーターを作成する特徴
パラメーター作成部である。各意味ごとに構造化
された情報領域の画像パターンは1次情報フアイ
ル4に、又特徴パラメーターはインデツクスとし
て2次情報フアイル5に格納される。検索時に於
いては検索入力装置6からキーインされたコード
に対し特定の文字パターンを発生するか、または
画像入力装置1および構造化抽出部2を用いて見
本とするパターンを入力し、検索キー生成部7で
検索用特徴パラメータを生成、照合機構8により
2次情報フアイル5の特徴パラメーターと照合を
行ない所要の画像情報や関連情報を画像出力装置
9に出力する。
なお、第1図において、点線の矢印は検索用特
徴パラメータの生成を示す。
次に動作についてより詳しく説明する。
名刺画像の構造を一般的にとらえると第2図a
のような構造をなしており、空白部分である非情
報領域と、情報領域に分割され、又、情報領域は
図形領域と文字領域に分割される。さらに文字領
域は第2図bに示されるように、姓名、所属、肩
書、住所等の意味情報ごとに分割される。構造化
抽出部2では、第2図cで示すように、名刺画像
より文字枠を外接長方形で切り出し、あらかじめ
組み込まれている名刺の構造に係る知識情報を用
いて文字枠の相対的な大きさや位置等によつて自
動的にその文字枠の担つている意名情膜を抽出す
る。ここで使われる知識情報は、名刺上の各意味
情報に対応する情報領域の配置(組版)の仕方の
タイプでありそのタイプを特定することによりた
とえば姓名という意味情報を持つと考えられる文
字枠を抽出できる。
文字の切り出しは次のような手順で行なう。
a 連結領域を囲む外接長方形を求める。
b 外接長方形の中で、重なり合つているものを
マージする。
c マークを分離する(例えば、会社等の商号等
で、第2図cではS.KENである。) d 活字の大きさ、文字は正方形に近い形をして
いる等の知識を使つてマージする。
切り出された文字は、抽出した姓名や所属等の
意味情報ごとに、ポインタにより文字列にまとめ
られ、その文字枠内の2値画像は第1図、1次情
報フアイル4に格納される。1次情報フアイルに
は別に符号化された情報や他の図形画像なども付
加できる。特徴パラメータ作成部3では文字列内
の個々の文字パターンについて、平均黒ラン数を
8次元の特徴パラメーターとして算出する。黒ラ
ン数とは、第3図aで示されるように、走査直線
A上にある黒点のかたまりの数である。文字枠を
第3図bのようにY方向を4つに分割し、1y(i)
(i=1、2、3、4)を部分領域内のY方向の
画素数、bx(i)(i=1、2、3、4)を部分
領域内の黒ラン数総和として、Xiを式のよう
に定義する。Xiは各部分領域を横切る縦線の平
均数となる。
Xi=bx(i)/1y(i)(i=1、2、3、4)……
また、同様にして第3図cのように文字枠をx方
向に4つに分割し、1x(k)(j=1、2、3、
4)を部分領域内のX方向の画素数、by(k)(j
=1、2、3、4)を部分領域の黒ラン数総和と
してYjを式のように定義する。
Yj=by(k)/1x(k)(j=1、2、3、4)……
このようなXi(i=1、2、3、4)、Yj(j
=1、2、3、4)を算出することによりで示
される8次元の特徴パラメーターを作成する。
(X1,X2,X3,X4,Y1,Y2,Y3,Y4
…… この特徴パラメータは、検索の為のインデツク
スとして、第1図5の2次情報フアイルに格納す
る。文字列のインデツクスは個々の文字について
8次元の特徴パラメータを求めたものであり、4
文字の時には32次元のベクトルとなる。
検索時においては、第1図、検索入力装置6か
ら姓名、会社名等のキー入力を行ない、それに対
応した漢字パターンを発生するか、または画像入
力装置1および構造化抽出部2を用いて見本とす
る文字パターン列を作成し、個々の文字の特徴パ
ラメーターからなる検索キーの生成を第1図の特
徴パラメータ作成部3と同様な方法で行なう。
照合は第1図、照合機構8で行なわれ、Xki
(i=1、2、3、4)、Ykj(j=1、2、3、
4)を検索キーの特徴パラメータとするとマツチ
ング距離Daを次のように定義する。
検索キーが2個以上の文字列で構成されている
場合には、順番の対応する各文字ごとにマツチン
グ距離を計算する。
第1図、照合機構8では検索すべき意味情報を
持つ第1図、2次情報フアイル5内に蓄積されて
いる各インデツクスに対して、文字列内の各文字
について式のDaを求め、それらを総合するこ
とにより照合が行なわれる。この照合により第1
図の1次情報フアイル4から選び出された名刺画
像情報およびそれに付属されているコード情報等
を、第1図、画像出力装置9に出力する。
なお、上記の方式では検索のキーは2次元情報
フアイル内のすべての名刺のインデツクスと照合
する必要があるが、第4図に示される検索テーブ
ルをあらかじめ作成しておくことによつて照合の
候補をしぼることができる。
第4図の検索テーブルは、10個×10個のボツク
ス10より構成されており、蓄積されている全ての
名刺の番号11は、いずれかのボツクスに記入さ
れている。番号を記入するボツクスは、各名刺に
対応する2次情報フアイル内のインデツクスから
BX,BYを次式のように算出し、 それらを10段階に量子化したBX′,BY′の値に
より決定する。姓名や所属の文字列については先
頭からの各順番の文字に対して各々検索テーブル
を作成する。照合時には、検索のキーとなる特徴
パラメータから式と同様にしてBXk′,BYk′を
求め、当該テーブル上で、BYk′,BYk′により決
定されるボツクスから一定の近傍範囲に入るボツ
クス内に記入されている名刺を候補として取扱
う。キーが文字列の場合には、各順番の文字ごと
に別々に候補のセツトを求め、それらの共通集合
のみについて照合を行なう。文字列の各順番の文
字により得られる候補のセツトは互にほぼ独立で
あることは、姓名の文字列について確認されてい
る。故に、照合範囲を1文字あたり3分の1程度
にしぼつたとしても、4文字の列の場合には34
81分の1に照合範囲を限定できる。
本実施例のフアイル構成を第5図に示す。矢印
は検索時におけるフアイルへのアクセス順序を示
しており、検索テーブル12により照合範囲を限
定した2次情報フアイル5内のインデツクスに対
し、検索のキーとして与えられた特徴パラメータ
との照合を行ない、一次情報フアイル4の内容を
出力する。管理フアイル41は個々の名刺データ
の統括的管理を行なう。各名刺の情報領域の画像
パターンは、文字枠ごとにパターン情報フアイル
42に蓄積されている。付属情報フアイル43に
は、各名刺データに付加されたコード情報等が蓄
積される。なお、以上の実施例では、画像フアイ
ルの蓄積と検索の対象として、名刺画像を取り上
げて説明を行つたが、例えば人名録や資材、商品
名簿などのように、ある決つた画像パターンの構
成で使用されるものに対し同様に対応することが
可能である。
以上のように、この発明によれば入力画像の構
造化蓄積を自動的に行ない検索時には特徴パラメ
ータを利用して検索を行なえるので、従来の人手
によつてデーターをキーインする方法に較べて著
しく人間の労力を省き、またOCR等により入力
する方法に較べて簡単でかつ信頼性高く画像の蓄
積と検索ができる。
【図面の簡単な説明】
第1図はこの発明の一実施例によるシステム構
成図、第2図は情報領域の構造と文字領域を示す
構造説明図、第3図は特徴パラメータの算出の仕
方を示す特徴パラメータ説明図、第4図は検索テ
ーブルの構成の仕方を示す検索テーブル説明図、
第5図は概略的なフアイル構成図である。 図において、1は画像入力装置、2は構造化抽
出部、3は特徴パラメータ作成部、41次情報フ
アイル、5は2次情報フアイル、6は検索入力装
置、7は検索キー生成部、8は照合機構、9は画
像出力装置、10はボツクス、11は名刺の番
号、12は検索テーブルを示す。

Claims (1)

  1. 【特許請求の範囲】 1 画像を入力する画像入力装置と、この画像入
    力装置の入力情報をその構造に係る知識情報を用
    いて、それぞれ意味を有する複数の情報領域と情
    報の存在しない領域とに分割し、上記情報領域の
    画像パターンと意味情報とを抽出する構造化抽出
    部と、この構造化抽出部より得た画像パターンを
    意味情報ごとに蓄積する1次情報フアイルと、上
    記構造化抽出部より得た画像パターンより特徴パ
    ラメータを作成する特徴パラメータ作成部と、こ
    の特徴パラメータ作成部より得た特徴パラメータ
    を意味情報ごとに蓄積する2次情報フアイルを備
    えた画像の蓄積装置。 2 画像を入力する画像入力装置と、この画像入
    力装置の入力情報をその構造に係る知識情報を用
    いて、それぞれ意味を有する複数の情報領域と情
    報の存在しない領域とに分割し、上記情報領域の
    画像パターンと意味情報とを抽出する構造化抽出
    部と、この構造化抽出部より得た画像パターンを
    意味情報ごとに蓄積する1次情報フアイルと、上
    記構造化抽出部より得た画像パターンより特徴パ
    ラメータを作成する特徴パラメータ作成部と、こ
    の特徴パラメータ作成部より得た特徴パラメータ
    を意味情報ごとに蓄積する2次情報フアイルを備
    えると共に、検索用画像から検索キーとなる特徴
    パラメータを作成する検索キー生成部と、上記22
    次情報フアイルと上記検索キー生成部で生成した
    上記検索キーとを照合する照合機構と、この照合
    機構の出力に基づいて、上記1次情報フアイルか
    ら関連する情報を出力する画像出力装置を備えた
    画像の蓄積検索装置。
JP56024570A 1981-02-20 1981-02-20 Accumulation system and retrieval system of picture Granted JPS57139866A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56024570A JPS57139866A (en) 1981-02-20 1981-02-20 Accumulation system and retrieval system of picture

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56024570A JPS57139866A (en) 1981-02-20 1981-02-20 Accumulation system and retrieval system of picture

Publications (2)

Publication Number Publication Date
JPS57139866A JPS57139866A (en) 1982-08-30
JPS6120908B2 true JPS6120908B2 (ja) 1986-05-24

Family

ID=12141816

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56024570A Granted JPS57139866A (en) 1981-02-20 1981-02-20 Accumulation system and retrieval system of picture

Country Status (1)

Country Link
JP (1) JPS57139866A (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2526044Y2 (ja) * 1989-10-16 1997-02-12 カシオ計算機株式会社 画像データ処理装置
JPH0363261U (ja) * 1989-10-16 1991-06-20
JP3405155B2 (ja) * 1997-11-07 2003-05-12 松下電器産業株式会社 文書検索装置

Also Published As

Publication number Publication date
JPS57139866A (en) 1982-08-30

Similar Documents

Publication Publication Date Title
US5721940A (en) Form identification and processing system using hierarchical form profiles
US9230353B2 (en) Method and apparatus for encoding/decoding image data
EP0202671B1 (en) Method of storing and retrieving image data
JP4118349B2 (ja) 文書選択等の方法及び文書サーバ
US20040213458A1 (en) Image processing method and system
US6061478A (en) Content-based filing and retrieval system for name cards and hankos
JP2004334339A (ja) 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム
JP2890482B2 (ja) 文書画像再配置ファイリング装置
Duygulu et al. A hierarchical representation of form documents for identification and retrieval
JP2004246577A (ja) 画像処理方法
JPS6120908B2 (ja)
JP2005149097A (ja) 画像処理システム及び画像処理方法
JP4323856B2 (ja) 画像処理方法
JP4310176B2 (ja) 画像処理装置、画像処理方法およびプログラム
EP0798653A2 (en) Method for retrieving an element of an image over a network
JPH06103402A (ja) 名刺認識装置
JPH09259132A (ja) 情報登録検索装置及びその方法
JPH0922442A (ja) イメージ・ドキュメント資料の電子管理システム
JP2005208872A (ja) 画像処理システム
JPH1027237A (ja) 文書ファイリング装置
JP2000148790A (ja) ファイリング方法及び装置並びに記憶媒体
JPS60123961A (ja) デ−タ記憶方法
JPH0554120A (ja) 文書分離方式
JP2008084127A (ja) 画像形成装置
JPH0573027A (ja) 個人筆跡辞書作成装置及び個人筆跡辞書を用いた文字出力処理装置