JP2007317034A - 画像処理装置、画像処理方法、プログラムおよび記録媒体 - Google Patents

画像処理装置、画像処理方法、プログラムおよび記録媒体 Download PDF

Info

Publication number
JP2007317034A
JP2007317034A JP2006147499A JP2006147499A JP2007317034A JP 2007317034 A JP2007317034 A JP 2007317034A JP 2006147499 A JP2006147499 A JP 2006147499A JP 2006147499 A JP2006147499 A JP 2006147499A JP 2007317034 A JP2007317034 A JP 2007317034A
Authority
JP
Japan
Prior art keywords
image
category
similarity
feature amount
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006147499A
Other languages
English (en)
Inventor
Koji Kobayashi
幸二 小林
Yukiko Yamazaki
由希子 山崎
Hirohisa Inamoto
浩久 稲本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2006147499A priority Critical patent/JP2007317034A/ja
Publication of JP2007317034A publication Critical patent/JP2007317034A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】曖昧な記憶を頼りに既知の画像を文書画像DBから分類、表示して検索するに際して、画像の絞り込みを容易にし、ユーザビリティを向上させる。
【解決手段】ユーザは画像分類をサーバ装置110へ指示する。類似度算出手段115は、分類カテゴリ毎の基準特徴量と特徴量DB114に登録済みの画像特徴量とを比較してカテゴリ毎の類似度を算出する。分類処理部117は、カテゴリ毎の類似度がしきい値以上の画像について、カテゴリ毎に類似度の高いものから順位付けし、カテゴリの画像数の結果を表示画面制御処理部118へ出力する。
【選択図】図1

Description

本発明は、文書画像の分類機能を備え、分類の態様の表示画面を作成する機能を備えた画像処理装置、画像処理方法、プログラムおよび記録媒体に関し、例えば、複写機の複合機、ファイルサーバ、画像処理プログラム等に好適な技術に関する。
紙文書をスキャナ等の入力デバイスを使用して電子化する例えば電子ファイリング等の装置があるが、専ら紙文書を大量に扱う業務用途として使用されていた。近年、スキャナの低価格化やスキャン機能を搭載したMFP(Multi Function Printer)の普及、またe−文書法等の法制化により一般的なオフィスにおいてもそのハンドリングの良さや利便性が認知され、紙文書をスキャンして電子化する機会が増えてきている。また、電子化された文書画像データをデータベース(以下DB)化して管理する画像DBの用途も増えてきている。例えば紙文書の原本を保存しておく必要があっても管理のし易さという点で画像DBを構築する場合もある。
このような文書画像DBにおいては、サーバ装置を設置して多数の人がアクセスする大規模なものから、個人のPC内にDBを構築するパーソナル用途のものまで様々である。また、近年のMFPでは内臓のHDDに文書を蓄積する機能を備えており、MFPをベースとして文書画像DBを構築する例もある。
このような文書画像DBにおいて、大量の文書画像から所望の文書画像を検索するために検索機能を備えたものがある。現在主流の検索機能は、OCR(Optical Character Reader)処理した文字認識結果をキーワードとして全文検索、または概念検索等を行うのが一般的となっている。しかし、このようなテキストベースの検索においては、
(1)OCRの精度に依存する
(2)検索キーワードが必要
(3)ヒット数が多い場合に絞り込みが困難
という問題点がある。
上記(1)については、OCRにより100%の正解を得ることは現状では不可能であるため、入力した検索キーワードの部分にOCRのミスがあればヒットしないという問題が生じる。上記(2)については、テキストベースの検索は、例えば、インターネットのHPを検索するような未知のものを検索する場合や、そのキーワードが明らかな場合には有効性が高いが、例えば数年前に入力した記憶が曖昧な文書を検索するような場合には、適切なキーワードが思い浮かばなければ検索することができない。また、ページ全体が写真やグラフィクスで文章が存在しない場合には当然ながら検索することができない。上記(3)については、テキストベースの検索の場合には順位付けが困難であるため、キーワードにヒットしたものは同格に扱われる。そのため、ヒット数が多い場合、ヒットした多数の文書画像を一つ一つ確認する必要があり、ユーザビリティが悪い。
ところで、写真画像の検索方法として、類似画像検索方法と画像を複数のカテゴリに分類して画像を絞り込んでいく画像分類方法がある。類似画像検索方法は、例えば特許文献1に開示されているように、問い合わせ画像に対して、色味や輪郭、模様等の画像の性質から特徴量を算出し、それら複数の特徴量に重み付けして問い合わせ画像との類似度を算出して順位付けする画像検索方法である。類似画像検索方法の特徴として、検索キーとして問い合わせ画像を使用する必要がある。手元の画像を問い合わせ画像として使用する場合には良いが、画像DB内の画像を問い合わせ画像に使用する場合は、まず問い合わせ画像を探す手間が必要で操作性が悪いという問題がある。
画像分類方法は、分類した画像の集合を選択すれば良いため操作性は良好となる。画像分類方法の例として特許文献2がある。特許文献2では、入力画像から抽出された特徴を基に画像をカテゴリに分類し、各カテゴリの代表的な画像を利用者に提示する。ユーザが選択した画像について、さらにサブカテゴリの画像を提示することによって段階的に画像を絞り込むことが可能となり、少ない提示回数で画像を提示することが可能となる。
また、類似画像検索方法と画像分類方法を融合させた例として、特許文献3がある。特許文献3では、問い合わせ画像から類似画像検索を行い、検索された複数の画像を画像特徴に基づいて分類し代表画像を表示し、類似度の高い画像は類似度順に表示し、類似度の低い画像は分類して代表画像を表示する。これにより、類似度の高い画像同士をまとめて表示することが可能となり、検索された画像間の類似性を考慮した表示が可能となる。
上記した方法によれば、分類した画像は各カテゴリ毎に代表画像のみを表示し、カテゴリを代表して表示される画像の選択方法は、カテゴリの重心位置の画像を選択している。
特開2000−285141号公報 特開平10−162020号公報 特開2001−273302号公報
しかし、上記した分類画像の表示方法では、ユーザは代表画像からカテゴリ内にどのような画像データが含まれているかを把握するのは難しい。例えば、画像DBに非常に多くの画像データが登録されていて、その分類結果を表示した場合に、一つのカテゴリには数多くの画像が分類されることになる。ユーザはそれらの表示結果を元にして一つまたは複数のカテゴリを選択し、検索対象である画像を絞り込むが、カテゴリ選択を誤ると、ユーザは検索対象画像が無いカテゴリ内を探すことになり、検索効率が著しく悪化する。
ユーザの検索効率の向上、すなわち画像分類での画像検索におけるユーザビリティの向上のためには、分類されたカテゴリ内に含まれる画像に「どのような画像が含まれているか」、そのカテゴリは「どのような画像の集合によるものか」(以下、カテゴリの内容と略す)をユーザに提示することが必要になる。
本発明は上記した問題点に鑑みてなされたもので、
本発明の目的は、曖昧な記憶を頼りに既知の画像を文書画像DBから分類、表示して検索するに際して、画像の絞り込みを容易にし、ユーザビリティを向上させ、また、画像DBにおける分類結果を表示するに際して、分類されたカテゴリの内容をユーザへ的確に提示することによって、カテゴリ選択の誤りをなくし検索効率を向上させた画像処理装置、画像処理方法、プログラムおよび記録媒体を提供することにある。
本発明は、画像データベースに蓄積されている画像データを検索する機能を有する画像処理装置であって、複数の基準特徴量を出力する基準特徴量出力手段と、各々の基準特徴量と前記特徴量算出手段により算出された画像特徴量を基に画像の類似度を算出する類似度算出手段と、各々の基準特徴量に対応して算出された類似度に応じて複数の分類カテゴリを形成する分類手段を備えたことを最も主要な特徴とする。
本発明によると、人の曖昧な記憶を頼りに、既知の画像を文書画像DBから分類、表示して検索するに際して、画像分類におけるカテゴリ内の画像をカテゴリ毎に設定した基準特徴量の類似度によって整列させているので、画像分類におけるカテゴリに含まれる画像内容の認識性、視認性が向上し、また、カテゴリ選択の誤りがなくなり、検索効率とユーザビリティが向上する。
本発明によると、1回の類似度算出処理において分類と画像の類似度による順位付けを行い、分類処理と類似画像検索処理を分けて処理しているので、画像分類の自由度が上がる。
本発明によると、画像分類結果の表示画面において、第一の方向にカテゴリを並べ、第二の方向にカテゴリに含まれる画像を並べる二次元的な表示形態によりカテゴリとカテゴリに含まれる画像データを表示しているので、カテゴリの種類の視認性とカテゴリに含まれる画像内容の認識性(つまりカテゴリにどのような画像が含まれるか、換言すればそのカテゴリの意味合い)の双方が向上する。
本発明によると、分類カテゴリの表示画像を類似度の所定間隔によってカテゴリの全体から選択しているので、表示画面内にカテゴリ内の全画像を表示出来ない場合でも、ユーザにそのカテゴリに含まれる画像の全容を示すことができ、ユーザが容易にカテゴリの内容を類推できる。
本発明によると、分類カテゴリの表示画像を類似度の順位の所定間隔によってカテゴリの全体から選択しているので、表示画面内にカテゴリ内の全画像を表示出来ない場合でも、ユーザにそのカテゴリに含まれる画像の全容を示すことができ、ユーザが容易にカテゴリの内容を類推できる。加えて、カテゴリ内の画像の偏りを反映した表示が可能となる。
本発明によると、カテゴリに含まれる画像数をカテゴリ毎に表示しているので、分類の対象となる画像の集合の全容をユーザに理解させることができる。
本発明によると、分類キーに応じて、カテゴリ毎の基準特徴量を設定しているので、1回の類似度算出処理において分類と画像の類似度による順位付けを行う場合でも分類キーに応じた基準特徴量を使用して画像を分類できる。
以下、発明の実施の形態について図面により詳細に説明する。
実施例1:
図1は、本発明の実施例1のシステム構成を示す。図1において、100はパーソナルコンピュータ(以下PC)、PDAや携帯電話等のモバイル端末等のクライアント装置である。101はモニタ等の表示デバイス、102はユーザ指示の解釈、サーバ110との通信、表示デバイス101の制御を行うアプリケーションプログラム、103はユーザからの指示入力手段であるキーボードやマウス等の入力デバイス、104はLANやインターネット等の外部通信路である。
110はクライアントからのコマンドに応じて画像分類を行い、分類結果をクライアント100へ出力するサーバ装置、111は外部通信路104とのインターフェース(以下I/F)、112は入力画像から画像特徴量を算出する特徴量算出処理部、113は登録画像119を蓄積するための画像DB、114は画像DB113に蓄積(登録)されている画像の特徴量を蓄積する特徴量DB、115は基準特徴量出力処理部116から出力された基準特徴量と特徴量DB114に蓄積された画像特徴量から画像の類似度を算出する類似度算出処理部、116は分類カテゴリ毎に分類カテゴリに応じた複数の基準特徴量を出力する基準特徴量出力処理部、117は分類カテゴリに対応した複数の基準特徴量との類似度に応じて分類カテゴリを形成する分類処理部、118は分類処理部115の結果によりクライアント100へ表示するための表示画面を生成する表示画面制御処理部、119は画像DB113へ登録する登録画像データ、120はクライアント100の表示デバイス101上へ表示される表示画面データである。なお、図中の点線は、画像登録時のデータの流れを表し、実線は画像分類処理を行って表示画面を生成する時のデータの流れを表している。
図2は、サーバ装置110の構成を示す。図2において、201はプログラムに応じた演算や処理を行うCPU、202はプログラムのコードや画像の符号データ等のデータを一時的に記憶、保持するワーク領域として使用される揮発性のメモリ、203は画像データやプログラム等を保存、蓄積するためのハードディスク(以下HDD)であり、画像DB113、特徴量DB114を保持する。204はモニタ205へ表示するためのデータバッファとなるビデオメモリである。ビデオメモリ204に書き込まれた画像データは、定期的にモニタ205へ表示される。206はマウスやキーボード等の入力デバイス、207はインターネットやLAN等の外部通信路104を介してデータを送受信する外部I/F、208は各々の構成要素を接続するバスである。
本実施例では、サーバ装置110がサーバコンピュータにより構成され、画像分類等の処理がソフトウェによって実現する例を示す。すなわち、サーバ内の処理は図示しないアプリケーションプログラムによって実現される。本発明の実施形態はこれに限定されず、MFP等の装置内にハードウェアによって処理を行うように構成しても良いし、また、サーバ、クライアント構成を採らずに、例えば1つのPCやMFP等の機器内に、図1を構成するようにしても良い。
以下、動作概要を説明する。画像DBは、大別すると二つの動作に分かれている。一つは画像の登録動作であり、もう一つは所望の画像を検索し、閲覧し、取得(サーバからのダウンロード)する「DB内の画像を利用する」動作である。画像の利用においては、所望の画像を検索する動作が不可欠であり、その後の動作は、アプリケーションのビューアーを使用して画像を閲覧し、ユーザのPC内へ蓄積する。画像分類は検索時の一つの機能であり、画像分類のみで検索が完了するとは限らない。画像分類と類似画像検索を組み合わせたり、あるいはテキスト検索を組み合わせることにより最終的に検索対象画像を見つけることが出来ればよい。本実施例では、画像登録時の動作と画像の検索動作時の一機能である画像分類と分類結果の表示について説明する。
図3は、画像登録時の動作フローチャートを示す。図1(破線は登録時の動作を示す)、図3を参照して画像登録動作を説明する。
ステップS001において、ユーザはクライアント装置100からアプリケーションプログラム102を介してサーバ装置110へ画像データの登録の指示と登録する登録画像データ119を指示する。
ステップS002において、登録画像データ119が外部通信路104を介してサーバ装置110へ入力され、外部I/F111を経由して画像DB113へ登録される。同時に、後述する特徴量算出処理部112では登録画像119の画像特徴量を算出し、算出した画像特徴量を特徴量DB114へ蓄積する。このとき、画像DB113への登録画像と特徴量DB114の特徴量は、ID番号等を使用して関連付けされて各々蓄積される。なお、画像DB113と特徴量DB114は上述の機能を満たせば、同じDBに例えばXML(eXtensible Markup Langage)等の言語を使用し階層的なデータ構造等を構築して蓄積しても良く、また、異なるサーバに別々なDBとして蓄積してもよい。また、画像の登録としては、スキャナやデジタルカメラ等の画像入力装置から直接、画像データをサーバ装置110へ登録するようにしても良い。
図4は、画像検索時の動作フローチャートを示す。図1、4を参照して、画像分類処理を使用した画像検索動作を説明する。
ステップS101において、ユーザはクライアント装置100上でアプリケーションプログラム102を使用して、画像分類をサーバ装置110へ指示する。指示手段は、例えば図5に示すサムネイル一覧の表示画面をクライアント装置100の表示デバイス101上へ表示する手段である。
図5において、301は画像分類による表示画面を指示する分類ラジオボタン、302はサムネイル表示を指示するサムネイルラジオボタン、303は画像を表示するフレーム、304は画像のサムネイルである。図5は、複数の画像サムネイル304がフレーム303上に表示されていることを示し、一般的な画像DBで使用されるサムネイルの一覧表示となっている。
通常、画像DB113には多くの画像が登録されているが、一度に表示しきれない画像サムネイルを閲覧する手段としては、フレームに上下のスライダを設けてスクロールして画像を閲覧し、ページ送り機能を設けて表示画像群を変更すれば良い。
ユーザは、入力デバイス103のマウス等のポインティングデバイスを使用して分類ラジオボタン301をクリックすることによって、サーバ側に画像分類指示が外部通信路104を介して転送される。
ステップS102において、サーバ装置110が画像分類指示を受信すると、後述する類似度算出処理部115は、分類カテゴリ毎の基準特徴量と特徴量DB114に登録済みの画像特徴量とを比較してカテゴリ毎の類似度を算出する。例えば、分類カテゴリ数が5の場合には、一画像について5個の類似度を算出する。
ステップS103において、分類処理部117は、類似度算出処理部115から出力されたカテゴリ毎の類似度について、類似度が所定のしきい値以上の類似度か否かを判定し、しきい値以上の画像についてカテゴリ毎に類似度の高いものから順位付けすると共にカテゴリ毎の画像数をカウントして、順位付けとカテゴリの画像数の結果を表示画面制御処理部118へ出力する。つまり、分類処理部117では、入力されたカテゴリ毎の類似度により各カテゴリ内に画像を含むか否かの判定と集計を実施するとともにカテゴリ内の画像を基準特徴量に対する類似度によって並べ替える処理を行う。
ステップS104において、表示画面制御処理部118は、分類処理部117の画像分類結果(登録画像毎のカテゴリ識別データ)とカテゴリ毎の画像数を入力し、表示画面のレイアウトを決定する。次いで、画像DB113より表示する画像データまたは画像データのサムネイルを入力し、画像分類結果の表示画面120を生成し、外部I/F111より外部通信路104を経由してクライアント100へ送信する。
図6は、分類結果表示画面の一例を示す。図6において、311は分類カテゴリの境界線、312はユーザのカテゴリ選択状況を示すチェックボックス、313はカテゴリ内の画像数、314は表示画面を横スクロールするスライダである。
なお、図6は4つのカテゴリに分類した例を示し、各々のカテゴリに311〜313が対応している。また、カテゴリ内のサムネイルは、各カテゴリに含まれる画像を表す。
ユーザがカテゴリ内にどのような画像が存在するか、換言すればカテゴリがどのような画像の集合体となっているかを確認する場合には、スライダ314を操作してスクロールすることによって各々のカテゴリに含まれる画像を簡易に確認できる。このように縦方向にカテゴリを並べ、横方向にカテゴリに含まれる画像を並べる2次元的な表示形態でカテゴリとカテゴリに含まれる画像データを表示することにより、カテゴリの種類の視認性とカテゴリに含まれる画像内容の認識性(つまりカテゴリにどのような画像が含まれるか、換言すればそのカテゴリの意味合い)の双方が向上する。
また、カテゴリ内の画像の並び順序は各カテゴリ毎の基準特徴量の類似度によって整列されているので、スライダ314により画像をスクロールする場合に、画像が徐々に変化し類似性の高い画像がある程度固まって表示されるので、カテゴリの全容に関する視認性が向上し、カテゴリの認知性が高まる。これは、検索対象の画像を探す場合にも関係の無い画像をある程度固まりの状態で(スクロール操作によって)読み飛ばすことができるので、検索の効率が向上する。
また、カテゴリに含まれる画像数が表示されているので、ユーザは分類対象となる画像集合の全容が分かる。これは、例えば分類対象が画像DB113に登録されている画像の全てであれば、DB113に登録された全容が分かるので、ユーザが「DBをどのように使用するか」、「どのような検索を行えば検索対象画像が探しやすいか」というヒントを提示できる。
なお、上記したような表示画面の作成方法やサーバクライアント間の通信方法には種々の手法があるが、一般的によく使用される手法としてサーバ装置110をWebサーバとしてWorldWideWebベースの技術を使用することにより実現可能となる。そして、表示画面120はHTML(HyperTextMarkupLangage)によって記述され、アプリケーション102は一般的なWebブラウザを使用すれば良い。
ステップS105において、クライアント装置100は表示デバイス101上に表示画面120を表示する。
ステップS106において、ユーザは、検索している画像に近いカテゴリを入力デバイス103を使用して選択し、選択したカテゴリデータをサーバ装置110へ送信する。
ステップS107において、サーバ装置110は、カテゴリ内選択指示を表示画面制御処理部118で受信し、図5のように選択されたカテゴリ内のサムネイル一覧の表示画面を作成し、クライアント装置100へ送信する。ここでは、画像の並び順は変更せずに図6の順序を保って画面を作成する。
ステップS108において、クライアント装置100は、表示デバイス101上に図5に示す表示画面120を表示する。
なお、ユーザは図5のサムネイル一覧から検索対象画像を探しても良いし、ステップS105の段階で、図6の表示画面を使用して探しても良いし、別な検索手段を使用し、あるいは前掲した特許文献2の方法のように再帰的に分類処理を繰り返しても良い。
図7は、特徴量算出処理部112の構成を示す。図7において、401は登録画像119から色特徴量の算出処理を行う色特徴算出処理部、402は登録画像119から形状特徴量の算出処理を行う形状特徴量算出処理部、403は登録画像119からレイアウト特徴量の算出処理を行うレイアウト特徴量算出処理部である。
色特徴量算出処理部401は、登録画像119から画像の背景色や色の分布等の画像の色味に関する特徴量である色特徴量を算出し、形状特徴量算出処理部402は、登録画像119から画像の形状に関する特徴量である形状特徴量を算出する。レイアウト特徴量算出処理部403は、画像要素単位でオブジェクトに分割し、オブジェクトの属性を判定してレイアウト情報を得た後、オブジェクト属性(例えばタイトル、文字、図形、写真、表等)毎の配置や面積率等を算出する。なお、写真画像等は、画像全体で一つの要素として算出され、文書画像と写真画像では特徴量が大きく異なるため、これらの混在したDBについても有効な手段となる。これら特徴量の算出処理は公知の手法を用いれば良い。
類似度算出処理部115における類似度算出処理を説明する。特徴量DB114に登録された画像の特徴量は、抽出した特徴量の種類毎に、図8に示すように特徴空間にマップされる。図8は、X,Y,Zの三つの特徴量から分類を行う例であり、各々の特徴量を軸とした空間に登録画像データ毎の特徴量をプロットしている。本実施例の基準特徴量は予め特徴空間上の1点を示し、図8ではこれを「×」で示す。基準特徴量のポイント「×」と各画像のポイント間の空間的な距離が類似度となる。
この空間的な距離が所定のしきい値以下の集合を1つのカテゴリとして分類する。図8では、501〜503のカテゴリに分類した例を示し、501と502の2つのカテゴリに跨った特徴点は2つのカテゴリに属するものとして分類する。カテゴリの中心点は、当該カテゴリの見本的な画像データによる特徴点となるので、予め定めておけば良い。また、各特徴量には重みを付け、それによって特徴量軸を変形させれば、特定の重みを重視した分類も容易に可能となる。また、カテゴリによって特徴量の使用/未使用や算出する特徴量を変更する等しても良い。
以上、説明したように本実施例によれば、画像分類におけるカテゴリ内の画像をカテゴリ毎に設定した基準特徴量の類似度によって整列させているので、画像分類におけるカテゴリに含まれる画像内容の認識性、視認性が向上し、ひいては検索効率が向上してユーザビリティが向上する。また、類似画像検索手段と同様な手法によって、画像分類が可能となるので、双方の機能を有する画像処理装置によってシステムが簡素化される。
実施例2:
図10は、実施例2における分類表示の例である。図6との相違点は、カテゴリ内での画像を少数に絞り、表示画像を1画面内に収めた点である。このように表示画像を絞ることにより、全体のシステム構成や画像DB113に登録されている画像数にもよるが、一般的に画面の表示速度が向上する。但し、本発明の趣旨であるカテゴリの認識性が低下するが、それを簡易的な手段で解決する方法を以下に示す。
図9は、本発明の実施例2のシステム構成を示す。実施例2では、分類処理部117から出力されたカテゴリ毎の複数の画像データから、表示を選択する表示画像選択処理部121を設けている。他の構成要素は実施例1と同様である。
実施例2の分類処理部117では、入力されたカテゴリ毎の類似度により各カテゴリ内に画像を含むか否かを判定し、カテゴリに含む画像を集計し、カテゴリ内の画像を基準特徴量に対する類似度によって並べ替えた結果を出力すると共に、画像毎の類似度のデータを表示画面選択処理部121へ出力する。
表示画像選択処理部121では、予め定められた所定の表示画像数と各カテゴリの画像数を基に、各カテゴリ毎の画像選択のための類似度の間隔を設定し、設定した間隔毎に表示画像を選択する。なお、狙いの類似度の画像が存在しない場合は直近の画像を選択するようにすれば良い。
図11は、実施例2の表示画像の選択処理を示す。図11は、画像を類似度順に整列させ、設定した類似度の間隔毎に表示画像を選択する例を示す。最低類似度は、分類処理部117での類似度の足切りのためのしきい値に相当する。この場合の類似度間隔は、下式で表される。
類似度間隔=(最高類似度−最低類似度)/表示画像数
上記したように分類カテゴリの表示画像をカテゴリの全体から選択することにより、表示画面内にカテゴリ内の全画像を表示できない場合でも、ユーザに対してそのカテゴリに含まれる画像の全容を提示することができ、ユーザはカテゴリの内容を容易に類推することができる。
なお、本実施例では、最高、最低類似度画像を表示する例を示したが、必ずしもこれらを含む必要はなく、ある程度類似度順の画像全体から、まばらに選択することによっても本発明の目的が達成できる。特に最低類似度画像付近は、図8の例のように、いくつかのカテゴリに跨って分類される可能性があり、本来のカテゴリの内容から外れていることもあるので、最低類似度画像付近を選択しない方が有効な場合もある。
また、類似度の間隔毎に表示画像を選択する例の他に、簡易的に類似度の順位を等間隔に選択する方法がある。この場合は、分類処理部117から表示画像選択処理部121へ類似度のデータを出力する必要がなくなり処理が簡単になるとともに、カテゴリ内の画像の偏りに反映した表示が可能となる利点がある。これは、例えば、カテゴリに含まれる画像が基準特徴量に類似した特徴量を持つ画像が数多くあれば、類似した特徴量を持つ画像が多く表示されることになる。また、上記の方法を表示文書数により切り替えるようにしても良い。表示文書数が多い場合には後者(順位を等間隔にする方法)の方が有利であり、少ない場合は前者(類似度を等間隔にする方法)がカテゴリの内容を表すのに優れている。
図12は、実施例2の他の表示画面例を示す。図12において、楕円(または円)314はカテゴリを表し、楕円314の大きさがカテゴリ内の文書数を間接的に表している。このような表示画面のレイアウトは様々な例が考えられる。
実施例3:
実施例1、2においては、類似画像検索の機能を使用して画像分類を行う例を示したが、本実施例では、特徴量から画像分類処理を実施して、分類カテゴリ毎に基準特徴量との類似画像検索を行う例を示す。
図13は、本発明の実施例3のシステム構成を示す。構成要素は実施例1と同様である。ただし、特徴量DB114、類似度算出処理部115、基準特徴量出力処理部116、分類処理部117の相互の接続関係が実施例1のものと相違している。
図14は、実施例3における文書画像検索時の動作フローチャートである。実施例1との相違点はステップS102’〜S103’であり、以下、相違する動作を説明する。
ステップS102’において、後述する分類処理部117では、登録画像の特徴量を特徴量DB114から入力し、処理対象画像毎にカテゴリ識別データを出力する。
ステップS103’において、基準特徴量出力処理部116では、分類処理部117から出力された分類カテゴリに応じて分類カテゴリ毎の基準特徴量を出力する。類似度算出処理部115では、分類処理部117から出力された分類カテゴリ毎に分類カテゴリに対応した基準特徴量と処理対象画像の特徴量との類似度を算出する。本実施例では、処理対象画像について、処理対象画像が属する分類カテゴリ分の数のみ類似度を算出する。通常、ほとんどの登録画像は1つの分類カテゴリ分の類似度が算出される。
次に、実施例1の分類処理部における処理と同様に、カテゴリ毎に類似度の高いものから順位付けすると共にカテゴリ毎の画像数をカウントして、順位付けとカテゴリの画像数の結果を表示画面制御処理部118へ出力する。なお、本実施例では、類似度のしきい値処理は行わない。つまり、本実施例における類似度算出処理部115では、カテゴリ毎の類似度により各カテゴリ内の画像を基準特徴量に対する類似度によって並べ替える処理を行う。
図15は、実施例3の分類処理部117の構成を示す。図15において、701は色特徴量を入力して色カテゴリを識別する色カテゴリ識別処理部、702は形状特徴量を入力して形状カテゴリを識別する形状カテゴリ識別処理部、703はレイアウト特徴量を入力してレイアウトカテゴリを識別するレイアウトカテゴリ識別処理部、704はレイアウト特徴量を入力して文書種類カテゴリを識別する文書種類カテゴリ識別処理部、705は分類キーによって各々のカテゴリ識別処理部701〜704から出力されるカテゴリ識別データを選択するセレクタである。
分類処理部117では、登録文書画像データの特徴量を特徴量DB114から入力し、各カテゴリ識別処理部701〜704においてカテゴリ識別処理を行って、予め設定された分類キーに応じた各々の登録画像に対するカテゴリ識別データを出力する。カテゴリ識別に関しては様々な手法が考えられるが以下、カテゴリ識別の手法に関する例を示す。
色カテゴリ識別データは、色特徴量として背景色や最も使用されている色等を代表色等として入力し、赤、青、緑、黄色、白等の複数のカテゴリを設け、近い色へ分類する。
形状カテゴリ識別データは、文書画像のエッジやテクスチャ等、複数の特徴量の類似度から分類を行う(これは、前述した図8と同様である)。レイアウトカテゴリ識別データは、形状識別データと同様に分類すれば良い。文書識別データは、レイアウト特徴量の複数の特徴量から段組等の文書種類の性質を用いて二分岐探索的に分類し、あるいは予め機械学習等の学習機によってレイアウトの特徴量データと識別する文書種類の正解データの対を教師データとして学習させ、レイアウト特徴量から学習データを用いて文書種類を識別する。なお、文書画像登録時に文書分類まで実施して、分類キー毎のカテゴリ識別データをDB化して保持するように構成しても良い。
このように算出された複数の分類カテゴリは、分類キーに応じて使用される1つがセレクタ705によって選択され、カテゴリ識別データとして出力される。分類キーは、分類をどのような観点で行うかを指定するものであり、サーバ側で予め設定した分類キーを使用したり、ユーザに選択させる等して決定すればよい。このように複数の分類キーを備えることにより再帰的な画像分類が可能となり、ユーザによる検索対象画像の絞り込みがさらに容易になる。なお、本実施例のように分類処理と類似画像検索処理を分けることによって、二分岐探索的な分類や機械学習等の手法を用いて画像の分類が可能となると共に、どこにも属さない画像を「その他」等としてユーザへの提示も可能となり、画像分類の自由度が高くなる。
実施例4:
実施例1の方法によって分類キーを変更するには、分類キーに応じて基準特徴量を変更するように構成すれば良い。実施例4のシステム構成は実施例1と同様である。
本実施例は、ユーザが所望の分類キーを選択可能とした実施例である。図16は、本実施例におけるサムネイル一覧の表示画面例を示す。実施例1では、分類を指示するラジオボタン301(以下分類ボタン)は1つであったが、本実施例ではレイアウト分類ボタン601、形状分類ボタン602、色分類ボタン603をそれぞれ備えており、ユーザが所望の分類キーを選択可能としている。なお、分類キーの情報は、分類指示をサーバ装置110へ転送する段階で同時に出力すれば良い。サーバ装置110は、分類キーを受信すると、基準特徴量出力処理部116において分類キーに対応した基準特徴量を設定する。
図17は、実施例4の基準特徴量出力処理部116の構成を示す。なお、基準特徴量は、カテゴリ数分存在するが、図17では説明の簡略化のため1つのカテゴリの基準特徴量出力処理のみに限定している。
図17において、801は色分類キー選択時の基準特徴量を発生する色基準特徴量発生処理部、802は形状分類キー選択時の基準特徴量を発生する形状基準特徴量発生処理部、803はレイアウト分類キー選択時の基準特徴量を発生するレイアウト基準特徴量発生処理部、804は分類キーによって基準特徴量を選択するセレクタである。
本実施例における基準特徴量出力処理部116は、分類キーによって分類キーに該当する基準特徴量801〜803がセレクタ804により選択され、該当するカテゴリの基準特徴量として類似度算出処理部115へ出力される。類似度算出処理部115は分類キーに対応した基準特徴量を使用して類似度を算出する。
以上、説明したように本実施例によれば、実施例1の構成(1回の類似度算出処理において分類と画像の類似度による順位付けを行う)においても分類キーに応じた基準特徴量を使用して、画像の分類が可能となる。
実施例1のシステム構成を示す。 実施例1のサーバ構成を示す。 実施例1の画像登録時の動作フローチャートを示す。 実施例1の文書画像検索時の動作フローチャートを示す。 実施例1のサムネイル一覧表示画面の例を示す。 実施例1の分類表示画面の例を示す。 実施例1の特徴量算出処理部の構成を示す。 特徴空間において画像群をカテゴリ分けした例を示す。 実施例2のシステム構成を示す。 実施例2の表示画面例を示す。 実施例2の表示画像の選択処理を示す。 実施例2の他の表示画面例を示す。 実施例3のシステム構成を示す。 実施例3の文書画像検索時の動作フローチャートを示す。 実施例3の分類処理部の構成を示す。 実施例4のサムネイル一覧表示画面の例を示す。 実施例4の基準特徴量出力処理部の構成を示す。
符号の説明
100 クライアント
101 表示デバイス
102 アプリケーション
103 入力デバイス
104 外部通信路
110 サーバ
111 外部I/F
112 特徴量算出処理部
113 画像DB
114 特徴量DB
115 類似度算出処理部
116 基準特徴量出力処理部
117 分類処理部
118 表示画面制御処理部
119 登録画像データ
120 表示画面データ

Claims (12)

  1. 画像データベースに蓄積されている画像データを検索する機能を有する画像処理装置であって、複数の基準特徴量を出力する基準特徴量出力手段と、各々の基準特徴量と前記特徴量算出手段により算出された画像特徴量を基に画像の類似度を算出する類似度算出手段と、各々の基準特徴量に対応して算出された類似度に応じて複数の分類カテゴリを形成する分類手段を備えたことを特徴とする画像処理装置。
  2. 前記分類手段により分類された態様を表示する表示画面を作成する表示画面制御手段をさらに備え、カテゴリに分類された画像を各カテゴリ毎の基準特徴量との類似度順に整列させて表示させることを特徴とする請求項1記載の画像処理装置。
  3. 画像データベースに蓄積されている画像データを検索する機能を有する画像処理装置であって、前記画像データから画像特徴量を算出する特徴量算出手段と、前記データベース内の画像データを前記画像特徴量に応じて複数のカテゴリに分類する分類手段と、前記分類手段により分類された態様を表示する表示画面を作成する表示画面制御手段と、前記カテゴリに応じた基準特徴量を出力する基準特徴量出力手段と、前記基準特徴量と前記特徴量算出手段により算出された画像特徴量を基に画像の類似度を算出する類似度算出手段と、各カテゴリに分類された画像データを前記カテゴリに応じた基準特徴量によりカテゴリ毎に類似度を算出する類似度算出手段と、各カテゴリに分類された画像を基準特徴量との類似度順に整列させて表示させることを特徴とする画像処理装置。
  4. 前記表示画面は少なくとも2次元に画像を配置し、第一の方向にカテゴリを配置して、第二の方向にカテゴリ内画像を配置することを特徴とする請求項2または3記載の画像処理装置。
  5. カテゴリ内に表示する複数の画像を選択する選択手段をさらに備え、前記選択手段は、カテゴリ内の画像を整列させた類似度の所定間隔毎に画像を選択することを特徴とする請求項1〜4のいずれか1項に記載の画像処理装置。
  6. 前記選択手段は、カテゴリ内の画像を整列させた順番の所定間隔毎に画像を選択することを特徴とする請求項5記載の画像処理装置
  7. 前記カテゴリ内の画像数を擬似的または直接的に表示することを特徴とする請求項5または6記載の画像処理装置。
  8. 分類キーに応じて前記基準特徴量を設定することを特徴とする請求項1〜3のいずれか1項に記載の画像処理装置。
  9. 画像データベースに蓄積されている画像データを検索する機能を有する画像処理方法であって、複数の基準特徴量を出力する基準特徴量出力工程と、各々の基準特徴量と前記特徴量算出工程により算出された画像特徴量を基に画像の類似度を算出する類似度算出工程と、各々の基準特徴量に対応して算出された類似度に応じて複数の分類カテゴリを形成する分類工程を有することを特徴とする画像処理方法。
  10. 画像データベースに蓄積されている画像データを検索する機能を有する画像処理方法であって、前記画像データから画像特徴量を算出する特徴量算出工程と、前記データベース内の画像データを前記画像特徴量に応じて複数のカテゴリに分類する分類工程と、前記分類工程により分類された態様を表示する表示画面を作成する表示画面制御工程と、前記カテゴリに応じた基準特徴量を出力する基準特徴量出力工程と、前記基準特徴量と前記特徴量算出工程により算出された画像特徴量を基に画像の類似度を算出する類似度算出工程と、各カテゴリに分類された画像データを前記カテゴリに応じた基準特徴量によりカテゴリ毎に類似度を算出する類似度算出工程と、各カテゴリに分類された画像を基準特徴量との類似度順に整列させて表示させることを特徴とする画像処理方法。
  11. 請求項9または10記載の画像処理方法をコンピュータに実現させるためのプログラム。
  12. 請求項9または10記載の画像処理方法をコンピュータに実現させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2006147499A 2006-05-27 2006-05-27 画像処理装置、画像処理方法、プログラムおよび記録媒体 Pending JP2007317034A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006147499A JP2007317034A (ja) 2006-05-27 2006-05-27 画像処理装置、画像処理方法、プログラムおよび記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006147499A JP2007317034A (ja) 2006-05-27 2006-05-27 画像処理装置、画像処理方法、プログラムおよび記録媒体

Publications (1)

Publication Number Publication Date
JP2007317034A true JP2007317034A (ja) 2007-12-06

Family

ID=38850821

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006147499A Pending JP2007317034A (ja) 2006-05-27 2006-05-27 画像処理装置、画像処理方法、プログラムおよび記録媒体

Country Status (1)

Country Link
JP (1) JP2007317034A (ja)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009181464A (ja) * 2008-01-31 2009-08-13 Hitachi Ltd 情報端末装置、情報端末装置の情報処理方法、および、情報処理プログラム
JP2009232450A (ja) * 2008-03-24 2009-10-08 Fujitsu Ltd 画像処理方法、画像処理装置及び透かし検出システム
JP2011523123A (ja) * 2008-05-14 2011-08-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 画像セグメンテーションに基づく画像分類
JP2011188293A (ja) * 2010-03-09 2011-09-22 Fuji Xerox Co Ltd 画像処理装置、画像処理システム、及び画像処理プログラム
JP2012521598A (ja) * 2009-03-26 2012-09-13 アリババ・グループ・ホールディング・リミテッド 形状に基づく画像検索
JP2014174807A (ja) * 2013-03-11 2014-09-22 Nec Personal Computers Ltd 情報処理装置、その制御方法、及びプログラム
JP2016051270A (ja) * 2014-08-29 2016-04-11 Kddi株式会社 集約コンテンツ生成装置、集約コンテンツ提供システム、集約コンテンツを生成する方法およびプログラム
JP2018045455A (ja) * 2016-09-14 2018-03-22 株式会社プロフィールド レイアウト装置、レイアウト方法、およびプログラム
EP3396566A1 (en) 2017-04-28 2018-10-31 Fujitsu Limited Method, information processing apparatus and program
JP2020046825A (ja) * 2018-09-18 2020-03-26 富士フイルム株式会社 画像表示制御装置、画像表示制御方法、プログラムおよび記録媒体
JP2022021316A (ja) * 2020-07-21 2022-02-02 株式会社 ミックウェア 情報処理装置、情報処理方法及び情報処理システム
US11430241B2 (en) 2018-01-30 2022-08-30 Mitsubishi Electric Corporation Entry field extraction device and computer readable medium
US11755907B2 (en) 2019-03-25 2023-09-12 Mitsubishi Electric Corporation Feature identification device, feature identification method, and computer readable medium

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009181464A (ja) * 2008-01-31 2009-08-13 Hitachi Ltd 情報端末装置、情報端末装置の情報処理方法、および、情報処理プログラム
JP2009232450A (ja) * 2008-03-24 2009-10-08 Fujitsu Ltd 画像処理方法、画像処理装置及び透かし検出システム
JP2011523123A (ja) * 2008-05-14 2011-08-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 画像セグメンテーションに基づく画像分類
US9042629B2 (en) 2008-05-14 2015-05-26 Koninklijke Philips N.V. Image classification based on image segmentation
JP2012521598A (ja) * 2009-03-26 2012-09-13 アリババ・グループ・ホールディング・リミテッド 形状に基づく画像検索
JP2013178790A (ja) * 2009-03-26 2013-09-09 Alibaba Group Holding Ltd 形状に基づく画像検索
JP2011188293A (ja) * 2010-03-09 2011-09-22 Fuji Xerox Co Ltd 画像処理装置、画像処理システム、及び画像処理プログラム
JP2014174807A (ja) * 2013-03-11 2014-09-22 Nec Personal Computers Ltd 情報処理装置、その制御方法、及びプログラム
JP2016051270A (ja) * 2014-08-29 2016-04-11 Kddi株式会社 集約コンテンツ生成装置、集約コンテンツ提供システム、集約コンテンツを生成する方法およびプログラム
JP2018045455A (ja) * 2016-09-14 2018-03-22 株式会社プロフィールド レイアウト装置、レイアウト方法、およびプログラム
EP3396566A1 (en) 2017-04-28 2018-10-31 Fujitsu Limited Method, information processing apparatus and program
US11430241B2 (en) 2018-01-30 2022-08-30 Mitsubishi Electric Corporation Entry field extraction device and computer readable medium
JP2020046825A (ja) * 2018-09-18 2020-03-26 富士フイルム株式会社 画像表示制御装置、画像表示制御方法、プログラムおよび記録媒体
US11755907B2 (en) 2019-03-25 2023-09-12 Mitsubishi Electric Corporation Feature identification device, feature identification method, and computer readable medium
JP2022021316A (ja) * 2020-07-21 2022-02-02 株式会社 ミックウェア 情報処理装置、情報処理方法及び情報処理システム
JP7090779B2 (ja) 2020-07-21 2022-06-24 株式会社 ミックウェア 情報処理装置、情報処理方法及び情報処理システム

Similar Documents

Publication Publication Date Title
JP2007317034A (ja) 画像処理装置、画像処理方法、プログラムおよび記録媒体
US7610274B2 (en) Method, apparatus, and program for retrieving data
US8086045B2 (en) Image processing device with classification key selection unit and image processing method
US8615716B2 (en) Content display control apparatus and content display control method
CN101178725B (zh) 用于信息检索的设备和方法
US8482808B2 (en) Image processing apparatus and method for displaying a preview of scanned document data
JP4920928B2 (ja) 画像処理装置及びその制御方法、プログラム
US20090183115A1 (en) Document searching apparatus, document searching method, and computer-readable recording medium
US20090106699A1 (en) Image processing device and image processing method
US8612429B2 (en) Apparatus, system, and method for information search
US20060271883A1 (en) Systems and methods for displaying linked information in a sorted context
JP2007200014A (ja) 情報処理装置、情報処理方法、情報処理プログラム及び記録媒体
JP2007049388A (ja) 画像処理装置及びその制御方法、プログラム
US8850359B2 (en) Image processor and image processing method
CN102694940B (zh) 信息处理装置及其控制方法
US20100057770A1 (en) System and method of file management, and recording medium storing file management program
US20080244384A1 (en) Image retrieval apparatus, method for retrieving image, and control program for image retrieval apparatus
JP2006004298A (ja) 文書処理装置、文書処理方法及び文書処理プログラム
JP2008040753A (ja) 画像処理装置、方法、プログラムおよび記録媒体
JP2008046823A (ja) 画像解釈装置、画像解釈方法、及びプログラム
JP2008052496A (ja) 画像表示装置、画像表示方法、プログラムおよび記録媒体
WO2008130501A1 (en) Unstructured and semistructured document processing and searching and generation of value-based information
JP2010092383A (ja) 電子文書ファイル検索装置、電子文書ファイル検索方法及びコンピュータプログラム
JP2007233752A (ja) 検索装置、コンピュータプログラム及び記録媒体
JP5389880B2 (ja) 電子ブック処理装置、電子ブック処理方法、およびプログラム