JPH04348475A - 画像情報検索方法及びその装置 - Google Patents
画像情報検索方法及びその装置Info
- Publication number
- JPH04348475A JPH04348475A JP3120914A JP12091491A JPH04348475A JP H04348475 A JPH04348475 A JP H04348475A JP 3120914 A JP3120914 A JP 3120914A JP 12091491 A JP12091491 A JP 12091491A JP H04348475 A JPH04348475 A JP H04348475A
- Authority
- JP
- Japan
- Prior art keywords
- image
- image information
- feature
- stored
- information retrieval
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 53
- 230000003287 optical effect Effects 0.000 claims description 45
- 238000005315 distribution function Methods 0.000 claims description 21
- 238000000605 extraction Methods 0.000 description 27
- 230000008569 process Effects 0.000 description 25
- 238000004364 calculation method Methods 0.000 description 22
- 238000010606 normalization Methods 0.000 description 14
- 238000012545 processing Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 239000000284 extract Substances 0.000 description 9
- 238000007781 pre-processing Methods 0.000 description 9
- 238000012546 transfer Methods 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【0001】
【産業上の利用分野】本発明は、画像の登録および検索
方式に係り、特に見本画像の書式情報を利用して検索す
る画像情報検索装置に適用して好適な画像の登録および
検索方式及びその装置に関する。
方式に係り、特に見本画像の書式情報を利用して検索す
る画像情報検索装置に適用して好適な画像の登録および
検索方式及びその装置に関する。
【0002】
【従来の技術】近年、画像ファイル装置がワードプロセ
ッサ、パーソナルコンピュータ、ファクシミリに続く第
4のOA(オフィス・オートメーション,Office
Automation)機器として登場し、オフィス
やデザイン部門のペーパーレス化を推進する手段として
注目を集めている。この画像ファイル装置は、光ディス
クを利用してイメージ情報を大量に蓄積し、必要に応じ
て即座に取り出して印刷出来るようになっている。した
がって、特に大量の文書が発生する部門への浸透には著
しいものがあり、大量に蓄積された文書の中から所望の
文書を取り出す検索の効率化が画像ファイル装置の大き
な課題の一つとなっている。
ッサ、パーソナルコンピュータ、ファクシミリに続く第
4のOA(オフィス・オートメーション,Office
Automation)機器として登場し、オフィス
やデザイン部門のペーパーレス化を推進する手段として
注目を集めている。この画像ファイル装置は、光ディス
クを利用してイメージ情報を大量に蓄積し、必要に応じ
て即座に取り出して印刷出来るようになっている。した
がって、特に大量の文書が発生する部門への浸透には著
しいものがあり、大量に蓄積された文書の中から所望の
文書を取り出す検索の効率化が画像ファイル装置の大き
な課題の一つとなっている。
【0003】そこで、効果的な検索を実現するため、キ
ーワードを利用した方法が広く流布している。すなわち
、画像データを登録する際にその画像の内容を差し示す
単語をキーワードとして付加する。そして、検索に際し
てこのキーワードを用いて所望の画像を探索する。この
キーワードの付け方は、画像の概念を表わす重要語句を
割り付ける方法が普通である。しかし、登録時にキーボ
ードからキーワードを一々入力せねばならず、この作業
に多大な工数を要するという欠点があった。この作業量
が、画像ファイル装置の普及を妨げる一要因となってい
た。
ーワードを利用した方法が広く流布している。すなわち
、画像データを登録する際にその画像の内容を差し示す
単語をキーワードとして付加する。そして、検索に際し
てこのキーワードを用いて所望の画像を探索する。この
キーワードの付け方は、画像の概念を表わす重要語句を
割り付ける方法が普通である。しかし、登録時にキーボ
ードからキーワードを一々入力せねばならず、この作業
に多大な工数を要するという欠点があった。この作業量
が、画像ファイル装置の普及を妨げる一要因となってい
た。
【0004】従来これらの不都合を解消する装置として
、特開昭61−75477号公報記載の装置が挙げられ
る。
、特開昭61−75477号公報記載の装置が挙げられ
る。
【0005】この従来技術は、登録すべき画像の特徴的
な部分を認識することによって、キーワードの自動登録
を達成している。すなわち、登録する画像を入力装置で
読み取り、読み取った画像の特徴的な部分を抽出する。 この入力画像が、予め格納された標準画像のいずれと一
致するかを識別する。そして、識別した結果コードをキ
ーワードとして画像と一緒に記憶装置に格納する。
な部分を認識することによって、キーワードの自動登録
を達成している。すなわち、登録する画像を入力装置で
読み取り、読み取った画像の特徴的な部分を抽出する。 この入力画像が、予め格納された標準画像のいずれと一
致するかを識別する。そして、識別した結果コードをキ
ーワードとして画像と一緒に記憶装置に格納する。
【0006】このようにして作成したキーワードは、画
像そのものから自動的に抽出される。したがって、登録
時にキーボードからキーワードを一々入力する必要が無
くなり、作業工数を大幅に削減できる。
像そのものから自動的に抽出される。したがって、登録
時にキーボードからキーワードを一々入力する必要が無
くなり、作業工数を大幅に削減できる。
【0007】最後に、検索時には登録した結果コードを
キーボード等により指定すれば、所望の画像を光ディス
クから読み出せるようになっていた。
キーボード等により指定すれば、所望の画像を光ディス
クから読み出せるようになっていた。
【0008】以上述べたように、従来技術を用いた装置
は、画像そのものからキーワードを自動的に抽出して登
録できるようになっていた。したがって、キーワードを
入力する作業が無くなり、記憶装置の中に大量の画像デ
ータを容易に登録できるようになっていた。
は、画像そのものからキーワードを自動的に抽出して登
録できるようになっていた。したがって、キーワードを
入力する作業が無くなり、記憶装置の中に大量の画像デ
ータを容易に登録できるようになっていた。
【0009】
【発明が解決しようとする課題】前述のように、上記従
来技術によれば、登録画像そのものから特徴的な部分を
識別し、識別結果をキーワードとして利用できるため、
キーボードから手作業で入力するのとは異なり、大量の
画像データの自動登録ができるようになった。
来技術によれば、登録画像そのものから特徴的な部分を
識別し、識別結果をキーワードとして利用できるため、
キーボードから手作業で入力するのとは異なり、大量の
画像データの自動登録ができるようになった。
【0010】しかしながら従来技術は、入力画像の図形
パターンあるいは文字パターンを認識し、結果コードを
キーワードとして利用する。このため、認識に伴う誤り
が発生する可能性が存在し、認識誤りを発見修正すると
いう新たな作業が発生するという欠点が残った。
パターンあるいは文字パターンを認識し、結果コードを
キーワードとして利用する。このため、認識に伴う誤り
が発生する可能性が存在し、認識誤りを発見修正すると
いう新たな作業が発生するという欠点が残った。
【0011】また検索に際し、画像そのものではなく、
画像から連想したキーワードを利用して検索する。この
キーワードは所詮語句にすぎないため、人間の直感と合
致した画像そのものでの検索が出来ないという欠点が残
った。
画像から連想したキーワードを利用して検索する。この
キーワードは所詮語句にすぎないため、人間の直感と合
致した画像そのものでの検索が出来ないという欠点が残
った。
【0012】さらに検索に際し、キーワードをキーボー
ドから入力しなければならないため、その作業が煩雑で
あるという欠点が残った。
ドから入力しなければならないため、その作業が煩雑で
あるという欠点が残った。
【0013】本発明の目的は、大量の文書画像の蓄積す
る画像情報検索装置において、登録時にキーワードの認
識誤りを発生させることなく、さらに検索時にキーボー
ド入力作業を無くした上で、人間の直感に合致した見本
画像を利用した検索が出来る画像の登録および検索方式
を提供することにある。
る画像情報検索装置において、登録時にキーワードの認
識誤りを発生させることなく、さらに検索時にキーボー
ド入力作業を無くした上で、人間の直感に合致した見本
画像を利用した検索が出来る画像の登録および検索方式
を提供することにある。
【0014】
【課題を解決するための手段】上記目的を達成するため
に、本発明は、画像情報検索装置において、まず検索す
べき種類の見本画像を入力し、入力した見本画像から特
徴を抽出する。次に画像記憶装置に蓄積した画像から同
様の特徴を抽出して、見本画像の特徴と照合する。最後
に照合結果にもとずいて、入力した見本画像と同一種類
の画像を出力するものである。
に、本発明は、画像情報検索装置において、まず検索す
べき種類の見本画像を入力し、入力した見本画像から特
徴を抽出する。次に画像記憶装置に蓄積した画像から同
様の特徴を抽出して、見本画像の特徴と照合する。最後
に照合結果にもとずいて、入力した見本画像と同一種類
の画像を出力するものである。
【0015】また、本発明においては、蓄積した画像か
ら上記特徴を抽出するかわりに、予め抽出して登録して
おくこともできる。
ら上記特徴を抽出するかわりに、予め抽出して登録して
おくこともできる。
【0016】上記照合情報に加え、入力した画像の特定
部分の文字あるいはマークを認識し、この認識結果も利
用して検索することもできる。
部分の文字あるいはマークを認識し、この認識結果も利
用して検索することもできる。
【0017】また、本発明は、上記特徴として、(1)
投影分布関数、(2)メッシュ密度特徴、(3)前2者
の組合せでも達成できる。
投影分布関数、(2)メッシュ密度特徴、(3)前2者
の組合せでも達成できる。
【0018】また、本発明は、他の見地によれば、画像
情報を第一のメモリ手段に格納し、属性情報を第二のメ
モリ手段に格納するメモリシステムにおいて、画像情報
から抽出した特徴量を第二のメモリ手段に登録しておき
、入力した見本画像の特徴量と照合することにより、第
一のメモリ手段に格納された画像を検索することによっ
ても達成できる。
情報を第一のメモリ手段に格納し、属性情報を第二のメ
モリ手段に格納するメモリシステムにおいて、画像情報
から抽出した特徴量を第二のメモリ手段に登録しておき
、入力した見本画像の特徴量と照合することにより、第
一のメモリ手段に格納された画像を検索することによっ
ても達成できる。
【0019】さらに、本発明は、他の見地によれば、画
像をデータ部に格納し、属性情報をインデックス部に格
納する光ディスクにおいて、入力した見本画像と照合す
る格納画像の特徴量をインデックス部に登録することに
よっても達成できる。
像をデータ部に格納し、属性情報をインデックス部に格
納する光ディスクにおいて、入力した見本画像と照合す
る格納画像の特徴量をインデックス部に登録することに
よっても達成できる。
【0020】最後に、本発明は、帳票管理システムにお
いて、まず、検索すべき種類の見本帳票を入力し、入力
した見本帳票から特徴を抽出する。次に画像記憶装置に
蓄積した帳票から同様の特徴を抽出して、見本帳票の特
徴と照合する。最後に、照合結果にもとずいて、入力し
た見本帳票と同一種類の帳票を出力するものである。
いて、まず、検索すべき種類の見本帳票を入力し、入力
した見本帳票から特徴を抽出する。次に画像記憶装置に
蓄積した帳票から同様の特徴を抽出して、見本帳票の特
徴と照合する。最後に、照合結果にもとずいて、入力し
た見本帳票と同一種類の帳票を出力するものである。
【0021】
【作用】上述した本発明の構成において、画像情報検索
装置は、登録と検索の2種類の処理を実行する。
装置は、登録と検索の2種類の処理を実行する。
【0022】まず、登録は、現行の画像ファイル装置と
同様の手順で登録する。すなわち、文書をスキャナから
入力し、2値化処理を経て画像記憶装置に格納する。以
降、説明の都合上、一例として文書を帳票、画像記憶装
置を光ディスクとして説明する。
同様の手順で登録する。すなわち、文書をスキャナから
入力し、2値化処理を経て画像記憶装置に格納する。以
降、説明の都合上、一例として文書を帳票、画像記憶装
置を光ディスクとして説明する。
【0023】属性情報は、従来のキーワードの替わりに
、帳票から特徴量を抽出し、これを光ディスクに格納す
る。
、帳票から特徴量を抽出し、これを光ディスクに格納す
る。
【0024】ここで、特徴の抽出は、帳票の性質に着目
し、これを利用する。すなわち、帳票の種類は、直線で
構成された図形部分が意味を持ち、文字部分は余り意味
を持たないという性質を持っている。そこで、直線の情
報を1次元へ写像する投影分布関数および直線の情報を
2次元のまま保存するメッシュ密度特徴を抽出し、光デ
ィスクに登録する。
し、これを利用する。すなわち、帳票の種類は、直線で
構成された図形部分が意味を持ち、文字部分は余り意味
を持たないという性質を持っている。そこで、直線の情
報を1次元へ写像する投影分布関数および直線の情報を
2次元のまま保存するメッシュ密度特徴を抽出し、光デ
ィスクに登録する。
【0025】図4を参照して、この様に抽出される特徴
を説明する。図4は、帳票に書かれた図形や文字から抽
出した特徴量を示す模式図である。図4(a)は、原画
像と投影分布関数を表し、図4(b)は同一の原画像に
対するメッシュ密度特徴を表している。また、図4(a
)のθは、不要となる文字成分を除去するための閾値で
あり、θ以下の黒画素成分を削除する。
を説明する。図4は、帳票に書かれた図形や文字から抽
出した特徴量を示す模式図である。図4(a)は、原画
像と投影分布関数を表し、図4(b)は同一の原画像に
対するメッシュ密度特徴を表している。また、図4(a
)のθは、不要となる文字成分を除去するための閾値で
あり、θ以下の黒画素成分を削除する。
【0026】この図から明らかなように、投影分布関数
は枠線の黒画素数を1次元へ写像しており、メッシュ密
度特徴は枠線の2次元構造を表している。したがって、
これらの特徴量を利用すれば、不自然な歪を除去した上
で、帳票の枠構造を表現できる。
は枠線の黒画素数を1次元へ写像しており、メッシュ密
度特徴は枠線の2次元構造を表している。したがって、
これらの特徴量を利用すれば、不自然な歪を除去した上
で、帳票の枠構造を表現できる。
【0027】以上の説明で明らかな様に、属性情報の登
録に当っては、操作者の介在は不要である。したがって
、操作者が登録に関与しないため、光ディスクへの登録
を自動化できる。
録に当っては、操作者の介在は不要である。したがって
、操作者が登録に関与しないため、光ディスクへの登録
を自動化できる。
【0028】検索処理は、見本帳票の入力とこれを用い
た類似帳票のスクリーニング処理に大別できる。
た類似帳票のスクリーニング処理に大別できる。
【0029】まず、見本帳票をスキャナから入力し、登
録時と同一の手順を踏んで、特徴量を抽出する。抽出し
た特徴は、次に述べるスクリーニング処理の類似度の算
出に供される。
録時と同一の手順を踏んで、特徴量を抽出する。抽出し
た特徴は、次に述べるスクリーニング処理の類似度の算
出に供される。
【0030】また、スクリーニング処理は、光ディスク
に格納された帳票の特徴量と入力された見本帳票の特徴
量との間で類似度を演算する。この評価値は、帳票の枠
構造が似ていれば、その値が高くなり、違ってくると小
さくなる傾向がある。したがって、評価値の高い帳票か
ら順に表示装置に出力すれば、入力した見本帳票と同一
種類の帳票が順に表示される。
に格納された帳票の特徴量と入力された見本帳票の特徴
量との間で類似度を演算する。この評価値は、帳票の枠
構造が似ていれば、その値が高くなり、違ってくると小
さくなる傾向がある。したがって、評価値の高い帳票か
ら順に表示装置に出力すれば、入力した見本帳票と同一
種類の帳票が順に表示される。
【0031】以上の説明で明らかなように、検索に当っ
ては、キーワードをキーボードから入力することなく、
見本帳票自身をスキャナから入力するだけで、所望の画
像を検索することができる。したがって、検索したい画
像の見本帳票を利用するため、人間に直感を反映した検
索を実現できる。
ては、キーワードをキーボードから入力することなく、
見本帳票自身をスキャナから入力するだけで、所望の画
像を検索することができる。したがって、検索したい画
像の見本帳票を利用するため、人間に直感を反映した検
索を実現できる。
【0032】以上述べた処理手順に従って、光ディスク
への登録および検索を実行する。
への登録および検索を実行する。
【0033】ここでは、特徴量を登録時に抽出し、予め
光ディスクに登録する方式を説明した。しかし、特徴量
を登録時に抽出せずに、検索時に登録画像から抽出する
方式でも良い。
光ディスクに登録する方式を説明した。しかし、特徴量
を登録時に抽出せずに、検索時に登録画像から抽出する
方式でも良い。
【0034】かくして本発明によれば、登録や検索に多
大な操作時間を要することなく、人間の直感に結び付く
見本帳票自体をスキャナから入力することにより類似画
像を検索できるので、従来と比べ飛躍的に使い勝手が向
上した画像情報検索装置を提供することができる。
大な操作時間を要することなく、人間の直感に結び付く
見本帳票自体をスキャナから入力することにより類似画
像を検索できるので、従来と比べ飛躍的に使い勝手が向
上した画像情報検索装置を提供することができる。
【0035】
【実施例】以下本発明の実施例について図面により説明
する。
する。
【0036】図1は本発明による一実施例の機能ブロッ
ク図である。11は入力帳票の光学画像からディジタル
画像を得るスキャナ、12はディジタル画像の大きさや
傾き等を補正する正規化部、13は正規化ディジタル画
像から特徴量を抽出する特徴抽出部、14はディジタル
画像と特徴量を対で蓄積する記憶装置、15は入力した
特徴量と蓄積された特徴量との間で類似度を算出する類
似度算出部、16は類似度の上位N個を順に選択する判
定部、17は判定部16の結果に従って記憶装置14か
ら該当画像を読みだし出力する出力装置である。なお、
この出力装置17は、ディスプレイであってもプリンタ
であっても差し支えない。 また、図5は入力する帳
票の一例である。これは、銀行等の金融機関において送
金の事務で利用する振替依頼票である。
ク図である。11は入力帳票の光学画像からディジタル
画像を得るスキャナ、12はディジタル画像の大きさや
傾き等を補正する正規化部、13は正規化ディジタル画
像から特徴量を抽出する特徴抽出部、14はディジタル
画像と特徴量を対で蓄積する記憶装置、15は入力した
特徴量と蓄積された特徴量との間で類似度を算出する類
似度算出部、16は類似度の上位N個を順に選択する判
定部、17は判定部16の結果に従って記憶装置14か
ら該当画像を読みだし出力する出力装置である。なお、
この出力装置17は、ディスプレイであってもプリンタ
であっても差し支えない。 また、図5は入力する帳
票の一例である。これは、銀行等の金融機関において送
金の事務で利用する振替依頼票である。
【0037】次に、本実施例の動作を登録と検索に分け
て説明する。
て説明する。
【0038】まず、登録処理では、スキャナ11に入力
された帳票は光学的に走査された後、ディジタル画像に
変換され正規化部12に入力される。
された帳票は光学的に走査された後、ディジタル画像に
変換され正規化部12に入力される。
【0039】正規化部12に入力されたディジタル画像
は、特徴抽出の前処理を施される。すなわち、図形パタ
ーンの大きさを均一化し、さらにノイズ成分を除去する
。これらの処理が施された後、特徴抽出部13に出力さ
れる。
は、特徴抽出の前処理を施される。すなわち、図形パタ
ーンの大きさを均一化し、さらにノイズ成分を除去する
。これらの処理が施された後、特徴抽出部13に出力さ
れる。
【0040】特徴抽出部13に入力されたディジタル画
像は、帳票の枠構造に着目した抽出法を用いて、その特
徴量を抽出する。すなわち、帳票の種類は、直線で構成
された図形部分が意味を持ち、文字部分は余り意味を持
たないという性質を持っている。そこで、直線の情報を
1次元へ写像する投影分布関数および直線の情報を2次
元のまま保存するメッシュ密度特徴を抽出し、記憶装置
14に登録する。
像は、帳票の枠構造に着目した抽出法を用いて、その特
徴量を抽出する。すなわち、帳票の種類は、直線で構成
された図形部分が意味を持ち、文字部分は余り意味を持
たないという性質を持っている。そこで、直線の情報を
1次元へ写像する投影分布関数および直線の情報を2次
元のまま保存するメッシュ密度特徴を抽出し、記憶装置
14に登録する。
【0041】まず、閾値θを利用して、不要となる文字
成分を除去する。すなわち、X軸方向とY軸方向を別々
に走査し、閾値θより小さな黒画素を文字成分であると
見做し、これを除去する。
成分を除去する。すなわち、X軸方向とY軸方向を別々
に走査し、閾値θより小さな黒画素を文字成分であると
見做し、これを除去する。
【0042】次に、文字成分を除去した2枚の画像を別
々に走査し、X軸とY軸に黒画素数を投影する。このよ
うにして、XとY両軸の投影分布関数が抽出できるが、
次の2点の理由から両軸の粗いブロックに分割し、次元
を圧縮する。すなわち、枠構造の位置変動を吸収し、さ
らに類似度の演算量を削減する。
々に走査し、X軸とY軸に黒画素数を投影する。このよ
うにして、XとY両軸の投影分布関数が抽出できるが、
次の2点の理由から両軸の粗いブロックに分割し、次元
を圧縮する。すなわち、枠構造の位置変動を吸収し、さ
らに類似度の演算量を削減する。
【0043】このため、A5版の帳票を200DPI(
ドット パーインチ,Dot Per Inch)で走
査し、XとY両軸を170次元および120次元とした
投影分布関数を抽出する。すなわち、1700ドット×
1200ドット程度のディジタル画像を約1/10の次
元に圧縮する。 ここで、次元数の圧縮量を約1/10としたが、本発明
はこれに限定されるものではない。また、170次元お
よび120次元の投影分布関数を順次処理して抽出した
が、一度の走査により抽出しても差し支えない。
ドット パーインチ,Dot Per Inch)で走
査し、XとY両軸を170次元および120次元とした
投影分布関数を抽出する。すなわち、1700ドット×
1200ドット程度のディジタル画像を約1/10の次
元に圧縮する。 ここで、次元数の圧縮量を約1/10としたが、本発明
はこれに限定されるものではない。また、170次元お
よび120次元の投影分布関数を順次処理して抽出した
が、一度の走査により抽出しても差し支えない。
【0044】また、メッシュ密度特徴の抽出にあたって
は、不要な文字成分を除去した2枚の画像を利用する。 すなわち、各軸方向に閾値θ以下の黒画素を除去した2
枚の画像から文字成分の除かれた1枚の画像を作成する
。
は、不要な文字成分を除去した2枚の画像を利用する。 すなわち、各軸方向に閾値θ以下の黒画素を除去した2
枚の画像から文字成分の除かれた1枚の画像を作成する
。
【0045】次に、この画像を2次元上で粗いブロック
に分割し、各ブロックの黒画素数を算出する。このよう
にして、2次元状のメッシュ密度特徴が抽出できる。こ
こで、上述の投影分布関数と同様の理由から、粗いブロ
ックに分割して次元を圧縮した。
に分割し、各ブロックの黒画素数を算出する。このよう
にして、2次元状のメッシュ密度特徴が抽出できる。こ
こで、上述の投影分布関数と同様の理由から、粗いブロ
ックに分割して次元を圧縮した。
【0046】このため、A5版の帳票を200DPIで
走査し、XとY両軸を40次元×30次元としたメッシ
ュ密度特徴を抽出する。すなわち、1700ドット×1
200ドット程度のディジタル画像を約1/40の次元
に圧縮する。ここで、次元数の圧縮量を約1/40とし
たが、本発明はこれに限定されるものではない。また、
40次元×30次元のメッシュ密度特徴を順次処理して
抽出したが、一度の走査により抽出しても差し支えない
。
走査し、XとY両軸を40次元×30次元としたメッシ
ュ密度特徴を抽出する。すなわち、1700ドット×1
200ドット程度のディジタル画像を約1/40の次元
に圧縮する。ここで、次元数の圧縮量を約1/40とし
たが、本発明はこれに限定されるものではない。また、
40次元×30次元のメッシュ密度特徴を順次処理して
抽出したが、一度の走査により抽出しても差し支えない
。
【0047】以上の説明から明らかなように、投影分布
関数は枠線の黒画素数を1次元へ写像しており、メッシ
ュ密度特徴は枠線の2次元構造を表わしている。したが
って、これらの特徴量を利用すれば、不自然な歪を除去
した上で、帳票の枠構造を表現できる。
関数は枠線の黒画素数を1次元へ写像しており、メッシ
ュ密度特徴は枠線の2次元構造を表わしている。したが
って、これらの特徴量を利用すれば、不自然な歪を除去
した上で、帳票の枠構造を表現できる。
【0048】記憶装置14に入力されたディジタル画像
と属性情報は、対をなす情報として、前者が画像データ
部に格納され、後者がインデックス部に格納される。
と属性情報は、対をなす情報として、前者が画像データ
部に格納され、後者がインデックス部に格納される。
【0049】以上、一連の登録動作を繰り返すことによ
り、記憶装置14に大量の画像が蓄積される。
り、記憶装置14に大量の画像が蓄積される。
【0050】一方、検索処理では、スキャナ11から見
本帳票が入力される。例えば、議事録を検索したい場合
は、見本帳票として同一種類の議事録をスキャナ11か
ら入力する。入力された見本帳票は、光学的に走査され
た後、ディジタル画像に変換され正規化部12に入力さ
れる。
本帳票が入力される。例えば、議事録を検索したい場合
は、見本帳票として同一種類の議事録をスキャナ11か
ら入力する。入力された見本帳票は、光学的に走査され
た後、ディジタル画像に変換され正規化部12に入力さ
れる。
【0051】正規化部12に入力されたディジタル画像
は、特徴抽出の前処理を施される。すなわち、図形パタ
ーンの大きさを均一化し、さらにノイズ成分を除去する
。これらの処理が施された後、特徴抽出部13に出力さ
れる。
は、特徴抽出の前処理を施される。すなわち、図形パタ
ーンの大きさを均一化し、さらにノイズ成分を除去する
。これらの処理が施された後、特徴抽出部13に出力さ
れる。
【0052】特徴抽出部13に入力されたディジタル画
像は、登録時と同様の特徴量を抽出する。すなわち、直
線の情報を1次元へ写像する投影分布関数および直線の
情報を2次元のまま保存するメッシュ密度特徴を抽出し
、類似度算出部15に出力する。
像は、登録時と同様の特徴量を抽出する。すなわち、直
線の情報を1次元へ写像する投影分布関数および直線の
情報を2次元のまま保存するメッシュ密度特徴を抽出し
、類似度算出部15に出力する。
【0053】類似度算出部15では、見本帳票の特徴量
の他に、記憶装置14からも登録画像の特徴量が入力さ
れ、以下の式にしたがって類似度が演算される。
の他に、記憶装置14からも登録画像の特徴量が入力さ
れ、以下の式にしたがって類似度が演算される。
【0054】
【数1】
【0055】ここで、X、Yは、見本帳票と登録画像の
N次元の特徴パターン、S(X,Y)は2つの特徴パタ
ーンに対する類似度である。この類似度は、帳票の枠構
造が似ていれば、その値が高くなり、違ってくると小さ
くなる傾向がある。見本帳票の特徴パターンに対して記
憶装置14に格納された登録画像の特徴パターンが順次
読出され、演算結果が判定部16へ出力される。以降、
記憶装置14に格納された全特徴パターンが読みだされ
る間で繰り返される。
N次元の特徴パターン、S(X,Y)は2つの特徴パタ
ーンに対する類似度である。この類似度は、帳票の枠構
造が似ていれば、その値が高くなり、違ってくると小さ
くなる傾向がある。見本帳票の特徴パターンに対して記
憶装置14に格納された登録画像の特徴パターンが順次
読出され、演算結果が判定部16へ出力される。以降、
記憶装置14に格納された全特徴パターンが読みだされ
る間で繰り返される。
【0056】判定部16へ入力された登録画像数に相当
する類似度は、値の大きい順にソートされ、上位N個が
選択される。これらN個に相当する画像番号が出力装置
16出力される。
する類似度は、値の大きい順にソートされ、上位N個が
選択される。これらN個に相当する画像番号が出力装置
16出力される。
【0057】出力装置17に入力された画像番号にした
がって、該当画像が記憶装置14から読出され、評価値
の大きな順に出力装置17に出力される。この出力装置
17は、ディスプレイが望ましいが、プリンタであって
も差し支えない。
がって、該当画像が記憶装置14から読出され、評価値
の大きな順に出力装置17に出力される。この出力装置
17は、ディスプレイが望ましいが、プリンタであって
も差し支えない。
【0058】また、ここで、類似画像N枚を順次表示す
る替わりに、N枚の画像を縮小して一括表示しても等価
である。
る替わりに、N枚の画像を縮小して一括表示しても等価
である。
【0059】次に、本発明の他の実施例について図面に
より説明する。図2は本発明の第2の実施例の構成を示
すブロック図である。
より説明する。図2は本発明の第2の実施例の構成を示
すブロック図である。
【0060】図2の構成は、概念的には図1と同じであ
るが、画像のみを記憶装置に登録する考え方を採用し、
記憶装置により多くの画像を登録できる構成を可能にし
ている。21は入力帳票の光学画像からディジタル画像
を得るスキャナ、22はディジタル画像の大きさや傾き
等を補正する正規化部、23は正規化ディジタル画像か
ら特徴量を抽出する特徴抽出部、24はディジタル画像
と特徴量を対で蓄積する記憶装置、25は記憶装置24
に蓄積したディジタル画像の大きさや傾き等を補正する
正規化部、26は正規化部25で正規化したディジタル
画像から特徴量を抽出する特徴抽出部、27は入力した
特徴量と蓄積された特徴量との間で類似度を算出する類
似度算出部、28は類似度の上位N個を順に選択する判
定部、29は判定部28の結果に従って記憶装置24か
ら該当画像を読みだし出力する出力装置である。なお、
この出力装置29は、ディスプレイであってもプリンタ
であっても差し支えない。
るが、画像のみを記憶装置に登録する考え方を採用し、
記憶装置により多くの画像を登録できる構成を可能にし
ている。21は入力帳票の光学画像からディジタル画像
を得るスキャナ、22はディジタル画像の大きさや傾き
等を補正する正規化部、23は正規化ディジタル画像か
ら特徴量を抽出する特徴抽出部、24はディジタル画像
と特徴量を対で蓄積する記憶装置、25は記憶装置24
に蓄積したディジタル画像の大きさや傾き等を補正する
正規化部、26は正規化部25で正規化したディジタル
画像から特徴量を抽出する特徴抽出部、27は入力した
特徴量と蓄積された特徴量との間で類似度を算出する類
似度算出部、28は類似度の上位N個を順に選択する判
定部、29は判定部28の結果に従って記憶装置24か
ら該当画像を読みだし出力する出力装置である。なお、
この出力装置29は、ディスプレイであってもプリンタ
であっても差し支えない。
【0061】次に、本実施例の動作を登録と検索に分け
て説明する。
て説明する。
【0062】登録処理では、スキャナ21に入力された
帳票は光学的に走査された後、ディジタル画像に変換さ
れ記憶装置24に入力される。記憶装置24に入力され
たディジタル画像は、そのまま画像データ部に格納され
る。この登録動作を繰り返すことにより、記憶装置24
に大量の画像が蓄積される。
帳票は光学的に走査された後、ディジタル画像に変換さ
れ記憶装置24に入力される。記憶装置24に入力され
たディジタル画像は、そのまま画像データ部に格納され
る。この登録動作を繰り返すことにより、記憶装置24
に大量の画像が蓄積される。
【0063】一方、検索処理では、スキャナ21から見
本帳票が入力される。入力された見本帳票は、光学的に
走査された後、ディジタル画像に変換され正規化部22
に入力される。正規化部22に入力されたディジタル画
像は、特徴抽出の前処理を施される。すなわち、図形パ
ターンの大きさを均一化し、さらにノイズ成分を除去す
る。これらの処理が施された後、特徴抽出部23に出力
される。特徴抽出部23に入力されたディジタル画像は
、第1の実施例と同一の特徴量を抽出する。すなわち、
直線の情報を1次元へ写像する投影分布関数および直線
の情報を2次元のまま保存するメッシュ密度特徴を抽出
し、類似度算出部27に出力するまた、入力された見本
帳票との類似度を算出するため、記憶装置24に蓄積さ
れた登録画像の特徴量を抽出する。記憶装置24の画像
データ部から登録画像が読みだされる。読みだされた登
録画像は、正規化部25に入力される。正規化部25に
入力されたディジタル画像は、特徴抽出の前処理を施さ
れる。すなわち、図形パターンの大きさを均一化し、さ
らにノイズ成分を除去する。これらの処理が施された後
、特徴抽出部26に出力される。特徴抽出部26に入力
されたディジタル画像は、見本帳票と同一の特徴量を抽
出する。すなわち、直線の情報を1次元へ写像する投影
分布関数および直線の情報を2次元のまま保存するメッ
シュ密度特徴を抽出し、類似度算出部27に出力する。 類似度算出部27では、見本帳票と登録画像の特徴量が
入力され、〔数1〕の演算が実行され、演算結果は判定
部28へ出力される。以降、記憶装置24に蓄積された
登録画像に対する演算が完了するまで繰り返される。判
定部18へ入力された登録画像数に相当する類似度は、
値の大きい順にソートされ、上位N個が選択される。こ
れらN個に相当する画像番号が出力装置29出力される
。
本帳票が入力される。入力された見本帳票は、光学的に
走査された後、ディジタル画像に変換され正規化部22
に入力される。正規化部22に入力されたディジタル画
像は、特徴抽出の前処理を施される。すなわち、図形パ
ターンの大きさを均一化し、さらにノイズ成分を除去す
る。これらの処理が施された後、特徴抽出部23に出力
される。特徴抽出部23に入力されたディジタル画像は
、第1の実施例と同一の特徴量を抽出する。すなわち、
直線の情報を1次元へ写像する投影分布関数および直線
の情報を2次元のまま保存するメッシュ密度特徴を抽出
し、類似度算出部27に出力するまた、入力された見本
帳票との類似度を算出するため、記憶装置24に蓄積さ
れた登録画像の特徴量を抽出する。記憶装置24の画像
データ部から登録画像が読みだされる。読みだされた登
録画像は、正規化部25に入力される。正規化部25に
入力されたディジタル画像は、特徴抽出の前処理を施さ
れる。すなわち、図形パターンの大きさを均一化し、さ
らにノイズ成分を除去する。これらの処理が施された後
、特徴抽出部26に出力される。特徴抽出部26に入力
されたディジタル画像は、見本帳票と同一の特徴量を抽
出する。すなわち、直線の情報を1次元へ写像する投影
分布関数および直線の情報を2次元のまま保存するメッ
シュ密度特徴を抽出し、類似度算出部27に出力する。 類似度算出部27では、見本帳票と登録画像の特徴量が
入力され、〔数1〕の演算が実行され、演算結果は判定
部28へ出力される。以降、記憶装置24に蓄積された
登録画像に対する演算が完了するまで繰り返される。判
定部18へ入力された登録画像数に相当する類似度は、
値の大きい順にソートされ、上位N個が選択される。こ
れらN個に相当する画像番号が出力装置29出力される
。
【0064】さらに、本発明の他の実施例について図面
により説明する。図3は本発明の第3の実施例の構成を
示すブロック図である。
により説明する。図3は本発明の第3の実施例の構成を
示すブロック図である。
【0065】図3の構成は、基本的には図1と同じであ
るが、プログラム制御の考え方を取り入れ、より柔軟性
に富む構成を可能にしている。31は装置全体をコント
ロールするCPU(中央処理装置、Central P
rocessing Unit)、32はCPU31を
制御するプログラムとテーブル類が格納されているメイ
ンメモリ、33は紙面を電気的な画像データに変換する
スキャナ、34はスキャナ33の駆動信号を生成し画像
データを転送するスキャナ制御回路、35は入力した画
像データを格納するイメージメモリ、36は、画像デー
タに対して前処理、特徴抽出、類似度演算等の画像処理
を施すイメージプロセッサ、37は画像データを表示す
るディスプレイ、38は同期信号を生成し画像データと
ともにディスプレイ37に転送するディスプレイ制御回
路、39は操作者からの指示を入力するキーボード、4
0はキーボード39からの指示情報をサンプリングしC
PU51へ転送するキーボード制御回路、41は画像デ
ータを紙面に印刷するプリンタ、42はプリンタ41の
駆動信号を生成し画像データを転送するプリンタ制御回
路、43は画像データと特徴量を対で蓄積する光ディス
ク、44は光ディスク43の駆動信号を生成し画像デー
タと特徴量を転送する光ディスク制御回路である。
るが、プログラム制御の考え方を取り入れ、より柔軟性
に富む構成を可能にしている。31は装置全体をコント
ロールするCPU(中央処理装置、Central P
rocessing Unit)、32はCPU31を
制御するプログラムとテーブル類が格納されているメイ
ンメモリ、33は紙面を電気的な画像データに変換する
スキャナ、34はスキャナ33の駆動信号を生成し画像
データを転送するスキャナ制御回路、35は入力した画
像データを格納するイメージメモリ、36は、画像デー
タに対して前処理、特徴抽出、類似度演算等の画像処理
を施すイメージプロセッサ、37は画像データを表示す
るディスプレイ、38は同期信号を生成し画像データと
ともにディスプレイ37に転送するディスプレイ制御回
路、39は操作者からの指示を入力するキーボード、4
0はキーボード39からの指示情報をサンプリングしC
PU51へ転送するキーボード制御回路、41は画像デ
ータを紙面に印刷するプリンタ、42はプリンタ41の
駆動信号を生成し画像データを転送するプリンタ制御回
路、43は画像データと特徴量を対で蓄積する光ディス
ク、44は光ディスク43の駆動信号を生成し画像デー
タと特徴量を転送する光ディスク制御回路である。
【0066】まず、登録処理では、メインメモリ32に
格納されたプログラムに基づいてCPU31からキーボ
ード制御回路40に起動が掛けられる。起動されたキー
ボード制御回路40はキーボード39から画像データの
スキャン命令を入力する。スキャン命令に基づいてスキ
ャナ制御回路34に起動が掛けられる。起動されたスキ
ャナ制御回路34はスキャナ33を駆動し、画像データ
を入力する。入力された画像データはイメージメモリ3
5に蓄積されたまま、イメージプロセッサ36に出力さ
れる。イメージプロセッサ36に入力された画像データ
は、特徴抽出の前処理を施される。すなわち、図形パタ
ーンの大きさを均一化し、さらにノイズ成分を除去する
。
格納されたプログラムに基づいてCPU31からキーボ
ード制御回路40に起動が掛けられる。起動されたキー
ボード制御回路40はキーボード39から画像データの
スキャン命令を入力する。スキャン命令に基づいてスキ
ャナ制御回路34に起動が掛けられる。起動されたスキ
ャナ制御回路34はスキャナ33を駆動し、画像データ
を入力する。入力された画像データはイメージメモリ3
5に蓄積されたまま、イメージプロセッサ36に出力さ
れる。イメージプロセッサ36に入力された画像データ
は、特徴抽出の前処理を施される。すなわち、図形パタ
ーンの大きさを均一化し、さらにノイズ成分を除去する
。
【0067】これらの処理が施された後、画像データは
第1の実施例と同様の図4の特徴量を抽出する。すなわ
ち、直線の情報を1次元へ写像する投影分布関数および
直線の情報を2次元のまま保存するメッシュ密度特徴を
抽出し、イメージメモリ35に出力する。イメージメモ
リ35に格納された特徴量は画像データの属性情報とし
て光ディスク43のインデックス部に登録する。すなわ
ち、画像データの特徴量がイメージメモリ35から読出
され、光ディスク制御回路44を介して光ディスク43
の所定の位置に登録される。
第1の実施例と同様の図4の特徴量を抽出する。すなわ
ち、直線の情報を1次元へ写像する投影分布関数および
直線の情報を2次元のまま保存するメッシュ密度特徴を
抽出し、イメージメモリ35に出力する。イメージメモ
リ35に格納された特徴量は画像データの属性情報とし
て光ディスク43のインデックス部に登録する。すなわ
ち、画像データの特徴量がイメージメモリ35から読出
され、光ディスク制御回路44を介して光ディスク43
の所定の位置に登録される。
【0068】最後に、画像データの本体を光ディスク4
3の画像データ部に登録する。すなわち、CPU31が
イメージプロセッサ36に起動を掛け、イメージメモリ
35に格納された画像データを符号データに変換する。 MH(Modified Huffman)あるいはM
2R(Modified2 READ)方式等で符号化
された画像データは、光ディスク43の画像データ部に
登録される。つまり、これらの符号データはイメージメ
モリ35から読出され、光ディスク制御回路44を介し
て光ディスク43の所定の位置に登録される。
3の画像データ部に登録する。すなわち、CPU31が
イメージプロセッサ36に起動を掛け、イメージメモリ
35に格納された画像データを符号データに変換する。 MH(Modified Huffman)あるいはM
2R(Modified2 READ)方式等で符号化
された画像データは、光ディスク43の画像データ部に
登録される。つまり、これらの符号データはイメージメ
モリ35から読出され、光ディスク制御回路44を介し
て光ディスク43の所定の位置に登録される。
【0069】以上、一連の登録動作を画像データが入力
される毎に繰り返すことにより、光ディスク43に大量
の画像が蓄積される。
される毎に繰り返すことにより、光ディスク43に大量
の画像が蓄積される。
【0070】一方、検索処理では、特徴抽出までは、登
録動作と同一の手順で処理される。
録動作と同一の手順で処理される。
【0071】まず、メインメモリ32に格納されたプロ
グラムに基づいてCPU31からキーボード制御回路4
0に起動が掛けられる。起動されたキーボード制御回路
40はキーボード39から画像データのスキャン命令を
入力する。スキャン命令に基づいてスキャナ制御回路3
4に起動が掛けられる。起動されたスキャナ制御回路3
4はスキャナ33を駆動し、見本帳票の画像データを入
力する。入力された画像データはイメージメモリ35に
蓄積されたまま、イメージプロセッサ36に出力される
。イメージプロセッサ36に入力された画像データは、
特徴抽出の前処理を施される。すなわち、図形パターン
の大きさを均一化し、さらにノイズ成分を除去する。
グラムに基づいてCPU31からキーボード制御回路4
0に起動が掛けられる。起動されたキーボード制御回路
40はキーボード39から画像データのスキャン命令を
入力する。スキャン命令に基づいてスキャナ制御回路3
4に起動が掛けられる。起動されたスキャナ制御回路3
4はスキャナ33を駆動し、見本帳票の画像データを入
力する。入力された画像データはイメージメモリ35に
蓄積されたまま、イメージプロセッサ36に出力される
。イメージプロセッサ36に入力された画像データは、
特徴抽出の前処理を施される。すなわち、図形パターン
の大きさを均一化し、さらにノイズ成分を除去する。
【0072】これらの処理が施された後、画像データは
第1の実施例と同様の図4の特徴量を抽出する。すなわ
ち、直線の情報を1次元へ写像する投影分布関数および
直線の情報を2次元のまま保存するメッシュ密度特徴を
抽出する。抽出した見本帳票の特徴量はイメージメモリ
35に格納され、光ディスク43から読出された登録済
み画像データの特徴量との間で式(1)の演算が実行さ
れる。以降、光ディスク43に蓄積された全特徴量に対
する演算が完了するまで繰り返される。
第1の実施例と同様の図4の特徴量を抽出する。すなわ
ち、直線の情報を1次元へ写像する投影分布関数および
直線の情報を2次元のまま保存するメッシュ密度特徴を
抽出する。抽出した見本帳票の特徴量はイメージメモリ
35に格納され、光ディスク43から読出された登録済
み画像データの特徴量との間で式(1)の演算が実行さ
れる。以降、光ディスク43に蓄積された全特徴量に対
する演算が完了するまで繰り返される。
【0073】演算が終了すると、メインメモリ52上に
各登録画像データに対する類似度と光ディスク43の格
納番地の一覧表が作成される。入力した見本帳票と類似
した画像データの順に選択するため、類似度の大きな順
にソートされ、上位N個の格納番地がCPU31を介し
て光ディスク制御回路44に通知される。通知された格
納番地に従って圧縮された符号データが光ディスク43
から読出され、イメージメモリ35に格納される。格納
された符号データはイメージプロセッサ36により伸長
され、画像データに変換される。最後に、伸長された画
像データは、ディスプレイ制御回路38を介してディス
プレイ37に表示される。
各登録画像データに対する類似度と光ディスク43の格
納番地の一覧表が作成される。入力した見本帳票と類似
した画像データの順に選択するため、類似度の大きな順
にソートされ、上位N個の格納番地がCPU31を介し
て光ディスク制御回路44に通知される。通知された格
納番地に従って圧縮された符号データが光ディスク43
から読出され、イメージメモリ35に格納される。格納
された符号データはイメージプロセッサ36により伸長
され、画像データに変換される。最後に、伸長された画
像データは、ディスプレイ制御回路38を介してディス
プレイ37に表示される。
【0074】以上の操作を繰返し、類似度の高い順に画
像データをディスプレイ37に表示し、所望の帳票画像
が表示された時点で処理を終了する。そして、所望の帳
票画像がディスプレイ37上に得られたら、必要に応じ
てプリンタ制御回路42に起動を掛け、プリンタ41に
より紙面に印刷する。
像データをディスプレイ37に表示し、所望の帳票画像
が表示された時点で処理を終了する。そして、所望の帳
票画像がディスプレイ37上に得られたら、必要に応じ
てプリンタ制御回路42に起動を掛け、プリンタ41に
より紙面に印刷する。
【0075】図6に、本発明による画像の登録方式の一
実施例のフローチャート(プロブレム・アナリシス・ダ
イアグラム、Problem−Analysis−Di
agram、以下PADとする)を示す。また図7に、
本発明による画像の検索方式の一実施例のフローチャー
ト(PAD)を示す。
実施例のフローチャート(プロブレム・アナリシス・ダ
イアグラム、Problem−Analysis−Di
agram、以下PADとする)を示す。また図7に、
本発明による画像の検索方式の一実施例のフローチャー
ト(PAD)を示す。
【0076】まず、登録処理では、画像データを入力す
る(S62)。本実施例では、この画像入力は自動給紙
機構付きのスキャナで帳票画像を走査するが、ファクシ
ミリ党による画像データの受信によっても実現できる。 次に、入力された画像データは、特徴抽出の前処理を施
される(S63)。すなわち、図形パターンの大きさを
均一化し、さらにノイズ成分を除去する。
る(S62)。本実施例では、この画像入力は自動給紙
機構付きのスキャナで帳票画像を走査するが、ファクシ
ミリ党による画像データの受信によっても実現できる。 次に、入力された画像データは、特徴抽出の前処理を施
される(S63)。すなわち、図形パターンの大きさを
均一化し、さらにノイズ成分を除去する。
【0077】これらの処理が施された後、画像データは
第1の実施例と同様の図4の特徴量を抽出する(S64
およびS65)。すなわち、直線の情報を1次元へ写像
する投影分布関数および直線の情報を2次元のまま保存
するメッシュ密度特徴を抽出し、イメージメモリ35に
出力する。
第1の実施例と同様の図4の特徴量を抽出する(S64
およびS65)。すなわち、直線の情報を1次元へ写像
する投影分布関数および直線の情報を2次元のまま保存
するメッシュ密度特徴を抽出し、イメージメモリ35に
出力する。
【0078】以上の手順で抽出した特徴量は画像データ
の属性情報として光ディスクのインデックス部に登録す
る(S66)。最後に、画像データの本体を光ディスク
の画像データ部に登録する。すなわち、入力された画像
データを符号データに変換する(S67)。MH(Mo
dified Huffman)あるいはM2R(Mo
dified2 READ)方式等で符号化された画像
データは、光ディスクの画像データ部に登録される(S
68)。
の属性情報として光ディスクのインデックス部に登録す
る(S66)。最後に、画像データの本体を光ディスク
の画像データ部に登録する。すなわち、入力された画像
データを符号データに変換する(S67)。MH(Mo
dified Huffman)あるいはM2R(Mo
dified2 READ)方式等で符号化された画像
データは、光ディスクの画像データ部に登録される(S
68)。
【0079】以上、一連の登録動作を画像データが入力
される毎に繰り返すことにより、光ディスクに大量の画
像が蓄積される(S61)。
される毎に繰り返すことにより、光ディスクに大量の画
像が蓄積される(S61)。
【0080】一方、検索処理では、特徴抽出までは、登
録動作と同一の手順で処理される。
録動作と同一の手順で処理される。
【0081】まず、図7において、見本帳票の画像デー
タを入力する(S71)。入力された画像データは、特
徴抽出の前処理を施される(S72)。すなわち、図形
パターンの大きさを均一化し、さらにノイズ成分を除去
する。これらの処理が施された後、画像データは第1の
実施例と同様の図4の特徴量を抽出する(S73および
S74)。すなわち、直線の情報を1次元へ写像する投
影分布関数および直線の情報を2次元のまま保存するメ
ッシュ密度特徴を抽出する。次に、光ディスクのインデ
ックス部に格納されている登録済み画像データの特徴量
を読みだす(S76)。光ディスクから読みだされた特
徴量は、抽出した見本帳票の特徴量との間で式(1)の
類似度の演算が実行される(S77)。以降、光ディス
クに蓄積された全特徴量に対する演算が完了するまで繰
り返される(S75)。
タを入力する(S71)。入力された画像データは、特
徴抽出の前処理を施される(S72)。すなわち、図形
パターンの大きさを均一化し、さらにノイズ成分を除去
する。これらの処理が施された後、画像データは第1の
実施例と同様の図4の特徴量を抽出する(S73および
S74)。すなわち、直線の情報を1次元へ写像する投
影分布関数および直線の情報を2次元のまま保存するメ
ッシュ密度特徴を抽出する。次に、光ディスクのインデ
ックス部に格納されている登録済み画像データの特徴量
を読みだす(S76)。光ディスクから読みだされた特
徴量は、抽出した見本帳票の特徴量との間で式(1)の
類似度の演算が実行される(S77)。以降、光ディス
クに蓄積された全特徴量に対する演算が完了するまで繰
り返される(S75)。
【0082】演算が終了すると、各登録画像データに対
する類似度と光ディスクの格納番地の一覧表が作成する
。入力した見本帳票と類似した画像データの順に選択す
るため、類似度の大きな順にソートする(S78)。 ソートの結果、通知された格納番地に従って圧縮された
符号データが光ディスクのデータ部から読みだされる(
S80)。読みだされた符号データは、伸長され、画像
データに変換される(S81)。最後に、伸長された画
像データは、上位M枚分、順次類似度の大きな順にディ
スプレイに表示される(S82)。
する類似度と光ディスクの格納番地の一覧表が作成する
。入力した見本帳票と類似した画像データの順に選択す
るため、類似度の大きな順にソートする(S78)。 ソートの結果、通知された格納番地に従って圧縮された
符号データが光ディスクのデータ部から読みだされる(
S80)。読みだされた符号データは、伸長され、画像
データに変換される(S81)。最後に、伸長された画
像データは、上位M枚分、順次類似度の大きな順にディ
スプレイに表示される(S82)。
【0083】以上の操作を繰返し、類似度の高い順に画
像データをディスプレイに表示し、所望の帳票画像が表
示された時点で処理を終了する(S79)。
像データをディスプレイに表示し、所望の帳票画像が表
示された時点で処理を終了する(S79)。
【0084】また、本発明の他の実施例である光ディス
クのデータ構造について図面により説明する。図8は光
ディスクへの画像データの格納例を示す模式図である。
クのデータ構造について図面により説明する。図8は光
ディスクへの画像データの格納例を示す模式図である。
【0085】91は画像データの属性情報を格納するイ
ンデックス部、92は画像データそのものを格納するデ
ータ部、93はインデックスデータの先頭を示すヘッダ
、94は画像データの第一の特徴量である特徴I、95
は画像データの第二の特徴量である特徴II、96はデ
ータ部のアドレスを示すポインタ、97はインデックス
データの終点を示すトレーラ、98はデータの先頭を示
すヘッダ、99は画像データの本体である符号データ、
100はデータの終点を示すトレーラである。
ンデックス部、92は画像データそのものを格納するデ
ータ部、93はインデックスデータの先頭を示すヘッダ
、94は画像データの第一の特徴量である特徴I、95
は画像データの第二の特徴量である特徴II、96はデ
ータ部のアドレスを示すポインタ、97はインデックス
データの終点を示すトレーラ、98はデータの先頭を示
すヘッダ、99は画像データの本体である符号データ、
100はデータの終点を示すトレーラである。
【0086】次に、本実施例のデータ構造について説明
する。
する。
【0087】インデックス部91とデータ部92は、各
々の集合体として別々の領域に格納されている。これに
よりデータ部92のデータを光ディスクから読みだすこ
となく、インデックス部91のみを読みだし、検索処理
の高速化を実現している。
々の集合体として別々の領域に格納されている。これに
よりデータ部92のデータを光ディスクから読みだすこ
となく、インデックス部91のみを読みだし、検索処理
の高速化を実現している。
【0088】また、インデックス部91とデータ部92
の各データは、ポインタ96で結合されている。このた
め、インデックス部91の検索処理でヒットしたデータ
は、ポインタ96のアドレスを参照することにより、素
早く光ディスクから読みだすことができる。
の各データは、ポインタ96で結合されている。このた
め、インデックス部91の検索処理でヒットしたデータ
は、ポインタ96のアドレスを参照することにより、素
早く光ディスクから読みだすことができる。
【0089】インデックス部91は、ヘッダ93、特徴
I94、特徴II95、ポインタ96およびトレーラ9
7の4部位から構成されており、このうちヘッダ93と
トレーラ97はデータの始点終点を示す一般的な識別子
である。また、特徴I94と特徴II95の領域には、
170次元および120次元程度の投影分布関数と40
次元×30次元程度のメッシュ密度特徴が格納されてお
り、これが検索処理に利用される本体である。ポインタ
96には、ヒットした符号データのアドレスが格納され
ている。
I94、特徴II95、ポインタ96およびトレーラ9
7の4部位から構成されており、このうちヘッダ93と
トレーラ97はデータの始点終点を示す一般的な識別子
である。また、特徴I94と特徴II95の領域には、
170次元および120次元程度の投影分布関数と40
次元×30次元程度のメッシュ密度特徴が格納されてお
り、これが検索処理に利用される本体である。ポインタ
96には、ヒットした符号データのアドレスが格納され
ている。
【0090】データ部92は、ヘッダ98、符号データ
99およびトレーラ100の3部位から構成されており
、このうちヘッダ98とトレーラ100はインデックス
部91と同様に一般的な識別子である。符号データ99
の領域には、MH(ModifiedHuffman)
あるいはM2R(Modified2 READ)方式
等で符号化された画像データが格納されており、この符
号データが伸長され、ディスプレイ等に表示される。上
記実施例では、画像の枠構造のみを利用する構成となっ
ているが、これに加えて、文字やマークを認識して識別
に利用する構成としても良い。 例えば、図5の帳票の右上に記された振込依頼票という
文字を認識し、これを利用する構成としても良い。
99およびトレーラ100の3部位から構成されており
、このうちヘッダ98とトレーラ100はインデックス
部91と同様に一般的な識別子である。符号データ99
の領域には、MH(ModifiedHuffman)
あるいはM2R(Modified2 READ)方式
等で符号化された画像データが格納されており、この符
号データが伸長され、ディスプレイ等に表示される。上
記実施例では、画像の枠構造のみを利用する構成となっ
ているが、これに加えて、文字やマークを認識して識別
に利用する構成としても良い。 例えば、図5の帳票の右上に記された振込依頼票という
文字を認識し、これを利用する構成としても良い。
【0091】以上の説明から明らかなように、本実施例
によれば、画像と共に枠構造の特徴量を自動的に登録し
、検索時に見本画像をスキャナから入力て類似度の大き
な画像を順次表示できるようにした。したがって、検索
、登録時間を削減した上で、人間の直感に合致した画像
検索が実現でき、画像ファイル装置のマン−マシンイン
ターフェースを大幅に改善することができる。
によれば、画像と共に枠構造の特徴量を自動的に登録し
、検索時に見本画像をスキャナから入力て類似度の大き
な画像を順次表示できるようにした。したがって、検索
、登録時間を削減した上で、人間の直感に合致した画像
検索が実現でき、画像ファイル装置のマン−マシンイン
ターフェースを大幅に改善することができる。
【0092】
【発明の効果】以上説明したように本発明によれば、検
索に用いるキーワードを人手の入力や自動認識で得るの
ではなく、特徴量のまま記憶装置に保持する構成となっ
ている。このため、人手によるキーボード入力作業を全
廃し、さらに認識誤りを発見修正する作業も全廃するこ
とができる。したがって、登録時の人手作業が不要とな
り、ひいては画像データの全自動登録を可能にできると
いう効果がある。
索に用いるキーワードを人手の入力や自動認識で得るの
ではなく、特徴量のまま記憶装置に保持する構成となっ
ている。このため、人手によるキーボード入力作業を全
廃し、さらに認識誤りを発見修正する作業も全廃するこ
とができる。したがって、登録時の人手作業が不要とな
り、ひいては画像データの全自動登録を可能にできると
いう効果がある。
【0093】また、検索条件の指示に検索すべき種類の
見本画像そのものをスキャナから入力する構成となって
いる。このため、従来のキーワードを入力するという煩
雑な作業が不要となり、しかも人間の直感と合致した画
像そのもので検索条件を瞬時に指定できる。したがって
、検索操作におけるマン−マシンインターフェースを大
幅に改善できるという効果がある。
見本画像そのものをスキャナから入力する構成となって
いる。このため、従来のキーワードを入力するという煩
雑な作業が不要となり、しかも人間の直感と合致した画
像そのもので検索条件を瞬時に指定できる。したがって
、検索操作におけるマン−マシンインターフェースを大
幅に改善できるという効果がある。
【図1】本発明に係る一実施例を示す機能ブロック図。
【図2】本発明に係る他の一実施例を示す機能ブロック
図。
図。
【図3】本発明に係る他の一実施例を示すブロック図。
【図4】特徴量を示す模式図。
【図5】見本帳票の一例。
【図6】本発明に係る登録の処理フローを示すフローチ
ャート(PAD)。
ャート(PAD)。
【図7】本発明に係る検索の処理フローを示すフローチ
ャート(PAD)。
ャート(PAD)。
【図8】本発明に係る光ディスクへの画像データの格納
例。
例。
11…スキャナ、
12…正規化部、
13…特徴抽出部、
14…記憶装置、
15…類似度算出部、
16…判定部、
17…出力装置、
21…スキャナ、
22…正規化部、
23…特徴抽出部、
24…記憶装置、
25…正規化部、
26…特徴抽出部、
27…類似度算出部、
28…判定部、
29…出力装置、
31…CPU(Central Processing
Unit)、32…メインメモリ、 33…スキャナ、 34…スキャナ制御回路、 35…イメージメモリ、 36…イメージプロセッサ、 37…ディスプレイ、 38…ディスプレイ制御回路、 39…キーボード、 40…キーボード制御回路、 41…プリンタ、 42…プリンタ制御回路、 43…光ディスク、 44…光ディスク制御回路、 44…イメージバス、 91…インデックス部、 92…データ部、 93…ヘッダ、 94…特徴I、 95…特徴II、 96…ポインタ、 97…トレーラ、 98…ヘッダ、 99…符号データ、 100…トレーラ。
Unit)、32…メインメモリ、 33…スキャナ、 34…スキャナ制御回路、 35…イメージメモリ、 36…イメージプロセッサ、 37…ディスプレイ、 38…ディスプレイ制御回路、 39…キーボード、 40…キーボード制御回路、 41…プリンタ、 42…プリンタ制御回路、 43…光ディスク、 44…光ディスク制御回路、 44…イメージバス、 91…インデックス部、 92…データ部、 93…ヘッダ、 94…特徴I、 95…特徴II、 96…ポインタ、 97…トレーラ、 98…ヘッダ、 99…符号データ、 100…トレーラ。
Claims (15)
- 【請求項1】画像を蓄積する手段と、該画像を検索する
手段と、検索した画像を出力する手段を備えた画像情報
検索装置において、検索すべき種類の見本画像を入力す
る手段と、該見本画像から特徴を抽出する手段と、前記
蓄積した画像から前記特徴を抽出して照合する手段と、
該照合結果にもとずいて前記見本画像と同一種類の画像
を出力する手段を備えたことを特徴とする画像情報検索
装置。 - 【請求項2】請求項一項記載の画像情報検索装置におい
て、前記蓄積した画像から前記特徴を抽出するかわりに
、予め抽出して登録しておくことを特徴とする画像情報
検索装置。 - 【請求項3】請求項一項および二項記載の画像情報検索
装置において、前記照合手段に加え、前記画像の特定部
分の文字あるいはマークを認識する手段と、該認識結果
を利用して検索する手段を備えたことを特徴とする画像
情報検索装置。 - 【請求項4】請求項一項および二項記載の画像情報検索
装置において、前記特徴として投影分布関数を利用する
ことを特徴とする画像情報検索装置。 - 【請求項5】請求項一項および二項記載の画像情報検索
装置において、前記特徴としてメッシュ密度特徴を利用
することを特徴とする画像情報検索装置。 - 【請求項6】請求項一項および二項記載の画像情報検索
装置において、前記特徴として投影分布関数とメッシュ
密度特徴とを併用することを特徴とする画像情報検索装
置。 - 【請求項7】画像情報を第一のメモリ手段に格納し、属
性情報を第二のメモリ手段に格納するメモリシステムに
おいて、前記画像情報から抽出した特徴量を第二のメモ
リ手段に登録しておき、入力した見本画像の特徴量と照
合することにより、第一のメモリ手段に格納された画像
を検索することを特徴とするメモリシステム。 - 【請求項8】画像をデータ部に格納し、属性情報をイン
デックス部に格納する光ディスクにおいて、入力した見
本画像と照合する格納画像の特徴量をインデックス部に
登録することを特徴とする光ディスク。 - 【請求項9】帳票を蓄積する手段と、該帳票を検索する
手段と、検索した帳票を出力する手段を備えた帳票管理
システムにおいて、検索すべき種類の見本帳票を入力す
る手段と、該見本帳票から特徴を抽出する手段と、前記
蓄積した帳票から前記特徴を抽出して照合する手段と、
該照合結果にもとずいて前記見本帳票と同一種類の帳票
を出力する手段を備えたことを特徴とする帳票管理シス
テム。 - 【請求項10】画像を入力する手段と、複数の該画像に
対応する画像情報を蓄積する画像記憶手段と、該画像情
報を検索する手段と、該検索手段によって検索した前記
画像情報を出力する手段とを有し、所定の画像情報を検
索して出力する画像情報検索方法において、検索すべき
種類の見本画像を入力し、入力された該見本画像の特徴
量を抽出し、蓄積された前記画像情報に対応する前記画
像の特徴量を順次取得し、これらの該特徴量を照合し、
該照合結果に基づき前記見本画像と同一種類の画像を出
力することを特徴とする画像情報検索方法。 - 【請求項11】蓄積された前記画像情報に対応する画像
の前記特徴量は、前記画像情報の蓄積時に、前記画像記
憶手段に蓄積しておくことを特徴とする請求項10記載
の画像情報検索方法。 - 【請求項12】前記特徴量を投影分布関数を用いて算出
することを特徴とする請求項10記載の画像情報検索方
法。 - 【請求項13】前記特徴量をメッシュ密度特徴を用いる
ことを特徴とする請求項10記載の画像情報検索方法。 - 【請求項14】前記画像及び前記見本画像は帳票の画像
であることを特徴とする請求項10記載の画像情報検索
方法。 - 【請求項15】蓄積された前記画像情報は前記画像蓄積
手段のデータ部に蓄積された画像データと、前記画像蓄
積手段のインデックス部に蓄積された前記特徴量とから
なることを特徴とする請求項11記載の画像情報検索方
法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3120914A JPH04348475A (ja) | 1991-05-27 | 1991-05-27 | 画像情報検索方法及びその装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3120914A JPH04348475A (ja) | 1991-05-27 | 1991-05-27 | 画像情報検索方法及びその装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH04348475A true JPH04348475A (ja) | 1992-12-03 |
Family
ID=14798120
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3120914A Pending JPH04348475A (ja) | 1991-05-27 | 1991-05-27 | 画像情報検索方法及びその装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH04348475A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0657831A1 (en) * | 1993-12-09 | 1995-06-14 | Canon Kabushiki Kaisha | Image retrieving method and apparatus |
JP2009295164A (ja) * | 2008-06-05 | 2009-12-17 | Toshiba Corp | オブジェクト取得装置、オブジェクト管理システム、オブジェクト管理方法 |
-
1991
- 1991-05-27 JP JP3120914A patent/JPH04348475A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0657831A1 (en) * | 1993-12-09 | 1995-06-14 | Canon Kabushiki Kaisha | Image retrieving method and apparatus |
US5644765A (en) * | 1993-12-09 | 1997-07-01 | Canon Kabushiki Kaisha | Image retrieving method and apparatus that calculates characteristic amounts of data correlated with and identifying an image |
JP2009295164A (ja) * | 2008-06-05 | 2009-12-17 | Toshiba Corp | オブジェクト取得装置、オブジェクト管理システム、オブジェクト管理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9710524B2 (en) | Image processing apparatus, image processing method, and computer-readable storage medium | |
US5650799A (en) | Programmable function keys for a networked imaging computer system | |
JP3602596B2 (ja) | ドキュメントファイリング装置および方法 | |
JP2001126026A (ja) | 情報入力装置 | |
US20230206672A1 (en) | Image processing apparatus, control method of image processing apparatus, and storage medium | |
US20010043742A1 (en) | Communication document detector | |
JP2007041709A (ja) | 文書処理システム、文書処理システムの制御方法、文書処理装置、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体 | |
JPH04348475A (ja) | 画像情報検索方法及びその装置 | |
JPH08180068A (ja) | 電子ファイリング装置 | |
JPH06103411A (ja) | 文書読取装置 | |
JPH0934903A (ja) | ファイル検索装置 | |
JPH05303619A (ja) | 電子スクラップブック | |
US11657632B2 (en) | Image processing device, image reading device, image processing method, and non-transitory computer readable medium, using two pieces of image data | |
JP4480109B2 (ja) | 画像管理装置および画像管理方法 | |
JP3486168B2 (ja) | 検索システム、ファイリングシステム、記録媒体 | |
JPH0757040A (ja) | Ocr付きファイリング装置 | |
JP4261831B2 (ja) | 文字認識処理方法、文字認識処理装置、文字認識プログラム | |
JPH07152856A (ja) | 光学的文字読取装置 | |
JP2005208872A (ja) | 画像処理システム | |
JPS594358Y2 (ja) | 文字修正における文字制御装置 | |
JP2849568B2 (ja) | 情報蓄積検索システム | |
JPH04302070A (ja) | 文字認識装置及び方法 | |
JPH06259594A (ja) | 光学的読取りデータの処理方法及び同装置 | |
JPS62134765A (ja) | 漢和辞書の電子検索方法 | |
JP2001127974A (ja) | 画像読取装置及びシステム |