JP2008052496A - 画像表示装置、画像表示方法、プログラムおよび記録媒体 - Google Patents
画像表示装置、画像表示方法、プログラムおよび記録媒体 Download PDFInfo
- Publication number
- JP2008052496A JP2008052496A JP2006227873A JP2006227873A JP2008052496A JP 2008052496 A JP2008052496 A JP 2008052496A JP 2006227873 A JP2006227873 A JP 2006227873A JP 2006227873 A JP2006227873 A JP 2006227873A JP 2008052496 A JP2008052496 A JP 2008052496A
- Authority
- JP
- Japan
- Prior art keywords
- image
- display
- attribute
- partial images
- partial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
Abstract
【課題】サムネイルのように一覧として表示された状態でプレビュー等の機能を必要とせずに文書内容を把握し、あるいは一覧の状態で各文書内容を確認しながら目的の作業が処理できる。
【解決手段】画像分割処理部113は入力画像のレイアウトを解析し、画像要素を部分画像に領域分割し、分割画像情報DB117に格納する。クライアント100からの文書画像のサムネイル表示要求に対して、画像選択処理部116は、DB117から画像サイズが最大の部分画像を複数選択し、クライアントに送信し、一覧表示する。
【選択図】図1
【解決手段】画像分割処理部113は入力画像のレイアウトを解析し、画像要素を部分画像に領域分割し、分割画像情報DB117に格納する。クライアント100からの文書画像のサムネイル表示要求に対して、画像選択処理部116は、DB117から画像サイズが最大の部分画像を複数選択し、クライアントに送信し、一覧表示する。
【選択図】図1
Description
本発明は、画像の構造を解析し、分割した部分画像を解析結果に基づいて一覧表示する画像表示装置、画像表示方法、プログラムおよび記録媒体に関し、例えば複写機の複合機、ファイルサーバ、画像処理プログラム等に好適な技術に関する。
紙文書をスキャナ等の入力デバイスを使用して電子化する例えば電子ファイリング等の装置があるが、専ら紙文書を大量に扱う業務用途として使用されていた。近年、スキャナの低価格化やスキャン機能を搭載したMFP(Multi Function Printer)の普及、またe−文書法等の法制化により一般的なオフィスにおいてもそのハンドリングの良さや利便性が認知され、紙文書をスキャンして電子化する機会が増えている。また、同時に電子化された文書画像データをデータベース(以下DB)化して管理する画像DBの用途も増加している。例えば、紙文書の原本が保存されていても、管理や検索のし易さから画像DBを構築する場合もある。
このような文書画像DBは、サーバ装置を設置して多数の人がアクセスする大規模なものから、個人のPC内にDBを構築するパーソナルな用途まで様々である。また、近年のMFPでは、内臓のHDDに文書を蓄積する機能を備えており、MFPをベースとして文書画像DBを構築する例もある。
このようなDB内に蓄積されている文書を再度、閲覧あるいは印刷など再利用しようとしたときに、目的の文書を探し出す一手段としてサムネイル表示がある。これは縮小した文書画像を画面上に複数個並べることで、簡易的に文書内容を把握することを目的としている。
例えば、レイアウトが類似している文書(特許公開公報のようなあまり特徴のないレイアウトの文書)画像を単純に等分割して、各エリアの一部だけを集めてサムネイルを生成する方法(特許文献1を参照)、表示画面上に複数枚の画像を認識可能な一部(画像のタイトル)のみを並べて表示する方法(特許文献2を参照)、文書種類を文字/絵柄に判別し、文字文書なら拡大表示したサムネイルとし、表示エリアは文書の先頭の文字領域を表示し、文字文書は固定的に先頭を拡大表示する方法(特許文献3を参照)、各文書ごとにその文書に存在している属性のアイコンを表示し、簡易的に構成要素を明示し、それに連動してオブジェクトを表示し、各文書単位での内容把握を補助する方法(特許文献4を参照)、表示画面を区分し、テキストとイメージを混在一覧表示し、また、縮小率を2つ設けて、それぞれに適した倍率で表示する方法(特許文献5を参照)などがある。
上記した特許文献1〜3は、テキスト画像の視認性を向上させた一覧表示に関するが、全て画像の一部を単純に切り出して拡大表示するものである。単純な切り出しのため、文の段落が無視されるので文脈が切れ、閲覧者はその切り出し部分だけで内容を把握することは難しく、切り出し部のフォントサイズによっては全く理解できないことも予想される。その場合、閲覧者は文書全体を再度、プレビューしなければならない。また、特許文献1〜3は文字部分を対象とし、図や表などの視認性については考慮されていない。
特許文献4、5は、テキスト以外の属性オブジェクトも対象としているが、一覧表示状態で複数の文書の内容を一度に把握するにはユーザーアクションが必要であり、表示内容から文書内容を把握することは難しい。
上記したように、限られた画面上に複数の文書を一度に表示するため、通常、個々の文書の縮小画像はかなり解像度を落とした画像となる。文書の構成要素が主に写真の場合は、解像度を落とした縮小画像の状態でもその内容把握は容易である。しかし、文字中心の文書の場合、その縮小画像では全く判読は不可能である。特にDB内の文書が同じようなレイアウトの文字中心の文書の場合、通常のサムネイル表示状態では目的の文書を判別できない。この場合、ユーザーは個々の文書をプレビュー機能を使って、画面上の新しいウィンドウ上に展開し、拡大表示して確認する必要がある。拡大率も通常、数段階用意されていて、当初の拡大率では文字が読めない場合は、更に拡大ボタンなどを使って詳細確認が可能となるまで拡大していく必要がある。また、このプレビュー機能もDBに保存されている元画像の解像度によっては表示の展開に多くのメモリを必要とし、メモリやCPU等のスペックによっては、文書表示に時間がかかる場合もある。
このように、サムネイル表示は写真画像の場合は有用な表示方法であるが、レイアウトが同じような文書画像や、文字中心の文書画像の場合は、目的文書の判別が極めて難しい。
本発明は上記した問題点に鑑みてなされたものであり、
本発明の目的は、MFPのHDD、またはサーバなどに蓄積された複数の文書画像中から目的の文書を探すための画像表示において、サムネイルのように一覧として表示された状態でプレビュー等の機能を必要とせずに文書内容を把握し、あるいは、一覧の状態で各文書内容を確認しながら目的の作業が処理でき、また、表示する単位を意味が成立する単位に切り出した部分画像とすることで、更に内容の把握を容易にした画像表示装置、画像表示方法、プログラムおよび記録媒体を提供することにある。
本発明の目的は、MFPのHDD、またはサーバなどに蓄積された複数の文書画像中から目的の文書を探すための画像表示において、サムネイルのように一覧として表示された状態でプレビュー等の機能を必要とせずに文書内容を把握し、あるいは、一覧の状態で各文書内容を確認しながら目的の作業が処理でき、また、表示する単位を意味が成立する単位に切り出した部分画像とすることで、更に内容の把握を容易にした画像表示装置、画像表示方法、プログラムおよび記録媒体を提供することにある。
本発明は、画像を部分画像に分割する画像分割手段と、該分割された部分画像の属性を判定する属性判定手段と、前記画像分割手段の分割結果と前記属性判定手段の属性判定結果に基づいて複数の部分画像を選択する画像選択手段と、前記選択された部分画像を所定の表示領域に表示する表示手段とを有することを最も主要な特徴とする。
請求項1、10:文書画像の構造を解析し、意味が成立する単位に部分画像として切り出したものを、一覧表示に用いることによって、表示されている画像自体の視認性を向上させ、その状態で文書内容の把握が容易となる。そのため、文書を再表示(プレビュー機能)する必要がないため、従来、必要とされた、ユーザーアクションや、画像の展開に要する時間が不要になり、ユーザーの待ち時間もなくなる。また、文書全体を展開するためのメモリも必要なく、表示する部分画像のメモリ分だけでよい。更に、一覧表示の状態で各文書の内容把握が可能となるので、文書が複数あるときに、ユーザーはスクロールなどのごく簡単なアクションで文書を追跡できる。
請求項2、11:表示する部分画像を画像中の最大サイズのものとすることで、文書の概要を端的に表している部分を表示することができ、ユーザーは文書内容の把握が容易となる。また、文書全体を表示対象とするよりも倍率を上げて表示できるため、視認性も向上させることができる。
請求項3、12:ユーザーの閲覧、印刷などの対象が、所定の属性の部分画像である場合に、その属性の部分画像のみを表示対象とすることができるので、検索効率、作業効率が向上する。
請求項4、13:存在している各属性種から代表画像を抽出して表示することにより、文書中に存在する複数種類の属性の部分画像を一覧として見ることできるので、検索効率が向上する。
請求項5、14:文字認識機能を用いてユーザーが記憶しているキーワードを入力として部分画像を抽出することができる。従って、キーワードを含む図や表はもちろん、画像としてのデザイン性などの情報も得ることができ、現状のキーワード検索による検索結果の出力では得られない各種情報をユーザーに提供することができ、検索効率が向上する。
請求項6、15:検索対象とする部分画像を所定の属性種のものに限定することにより、文字認識処理の負荷が低減され、表示までの処理が高速化される。
請求項7、16:所定の部分画像同士を関連付けし、図や表のキャプションなどを一体化したものを表示対象として扱うことにより、その部分画像単体で意味が成立したオブジェクトを表示することが可能となり、一覧表示状態で、更に文書内容の把握が容易になり、検索効率が向上する。
請求項8、17:部分画像に含まれている文字の大きさに応じて、表示の倍率を決定することで、表示されている文書の視認性が向上し、検索効率が向上する。
請求項9、18:ユーザーが表示形態を選択できるので、好みに応じた、あるいはDBに蓄積されている文書種類に応じた表示を行うことができ、ユーザビリティーが向上する。
以下、発明の実施の形態について図面により詳細に説明する。
実施例1:
図1は、本発明の実施例1のシステム構成例を示し、クライアントとサーバが外部I/Fによって接続されている場合を例に説明する。本発明は、基本的には、(1)画像登録、(2)登録画像の表示の2つの処理に大別され、図中の実線の矢印は(1)画像登録時における処理を示し、点線の矢印は(2)登録画像の表示における処理を示す。
図1は、本発明の実施例1のシステム構成例を示し、クライアントとサーバが外部I/Fによって接続されている場合を例に説明する。本発明は、基本的には、(1)画像登録、(2)登録画像の表示の2つの処理に大別され、図中の実線の矢印は(1)画像登録時における処理を示し、点線の矢印は(2)登録画像の表示における処理を示す。
図1において、100はパーソナルコンピュータ(以下PC)、PDAや携帯電話等のモバイル端末等のクライアント装置である。101はモニタ等の表示デバイス、102はユーザ指示の解釈、サーバ110との通信、表示デバイス101の制御を行うアプリケーションプログラム、103はユーザからの指示入力手段であるキーボードやマウス等の入力デバイス、104はLANやインターネット等の外部通信路である。
110はクライアント100からの閲覧要求に応じて表示する画像をクライアント100へ出力するサーバ装置、111は外部通信路104とのインターフェース(以下I/F)、112は画像DBの登録、読み出し等を制御する画像DB制御処理部、113は入力画像のレイアウトを解析し、画像要素を部分画像に領域分割してオブジェクト化する画像分割処理部、114は分割された画像の特徴から属性を判定するオブジェクト属性解析処理部、115は登録画像を蓄積するための画像DB、116は画像分割処理部113の結果と属性解析処理部114の結果を基に表示画像を選択する画像選択処理部、117は画像分割処理部113で分割された部分画像、及び画像情報を蓄積するための分割画像情報DBである。
図2は、サーバ装置110の構成を示す。図2において、201はプログラムに応じた演算や処理を行うCPU、202はプログラムのコードや画像の符号データ等のデータを一時的に記憶、保持するワーク領域として使用される揮発性のメモリ、203は画像データやプログラム等を保存、蓄積するためのハードディスク(以下HDD)、204はモニタ205へ表示するためのデータバッファとなるビデオメモリである。ビデオメモリ204に書き込まれた画像データはモニタ205へ表示される。206はインターネットやLAN等の外部通信路104を介してデータを送受信する外部I/F、207は各々の構成要素を接続するバスである。なお、マウスやキーボード等の入力デバイスは、説明の簡略化のために省略している。
本実施例では、サーバ、クライアント間による実施形態を例に説明する。本発明の実施形態はこれに限定されず、MFP等の装置内にハードウェアによって処理を行うように構成しても良いし、また、サーバ、クライアント構成を採らずに、例えば1つのPCやMFP等の機器内に、図1を構成するようにしても良い。
また、表示に用いられる文書全体の縮小画像、または分割画像などすべてのデータはあらかじめサーバ110で生成され、画像DB115、もしくは分割画像情報DB117に保存されているものとする。
クライアント側110では、アプリケーション102上で、画像DB115、もしくは分割画像情報DB117内に保存されている画像の一覧(サムネイル)表示を行う。
サーバ110は画像データを入力し、記憶媒体へ保存し、データベース(DB)化しておく。画像の入力形態については、種々の方法があるが、例えば、サーバに接続されたスキャナ等の専用機器からビットマップ画像を入力する、ネットワーク経由によりサーバに接続されたスキャナやクライアントPC等の外部機器から電子画像データを受信する。なお、電子画像データとしては、PDF等の特定フォーマットデータや、ビットマップをJPEGやJPEG2000等で圧縮処理されたデータなどがある。またWORD、EXCEL等といった特定アプリケーションのデータや、PS(ポストスクリプト)やプリンタドライバが出力するPDLなどのデータ形態があり、その形態も多様である。
また、画像データのDBの蓄積形態についても種々の方法がある。例えば、入力の形態のまま蓄積(例えば、JPEG圧縮画像データやPDFデータ等が混在する形態)、所定のフォーマットの形態に変換して蓄積(例えば、全てJPEG等の同一フォーマットへ変換して蓄積)などである。また、入力形態に応じて数種類のフォーマットを混在させても良い。例えば、スキャン画像等のビットマップ形式の画像データであればJPEG圧縮画像として蓄積し、特定アプリケーションの電子データであれば、PDFフォーマットの画像データとして蓄積しても良い。
本実施例では、以下、説明するように、DBからビットマップ画像や電子データを抽出し、レイアウト解析、オブジェクト分割、属性判定、画像選択を行い、クライアント端末100へ画像を配信し、クライアント側で表示、及び閲覧する。
図1のシステム構成において、画像DBに蓄積する場合、基本的には、(1)画像登録、(2)登録画像の表示の2つの処理に大別される。
図3は、画像登録における処理フローチャートを示す。ユーザーが登録画像を入力する(ステップ1)。例えば、スキャナにより複数枚の文書を一度に読み込み、あるいは一文書ごとに入力する。入力画像は外部通信路104、外部I/F111、画像DB制御部112を経て画像分割処理部113に取り込まれ、部分画像に分割される(ステップ2)。この部分画像のサイズは表示画像のサイズとは直接関係ない。
次に、オブジェクト属性解析処理部114は、分割された個々の部分画像の属性を解析する(ステップ3)。ここで、各部分画像に対して、文字、写真、図などの属性情報が割り付けられる。以上の処理を全ての入力画像に対して行う(ステップ4)。
図4は、登録画像の表示処理のフローチャートを示す。ユーザーがDBなど、画像を蓄積している記憶媒体へアクセスし、そこにある文書画像のサムネイル表示を要求する(ステップ11)。サーバ110の画像DB制御部112は該要求を受け付け、画像選択処理部116は、後述する各種表示条件により表示に用いる画像を選択し、クライアント100に送信する(ステップ12)。クライアント100のアプリケーション102は、選択された画像をモニタなど表示媒体にあわせた表示形態に生成する(ステップ13)。
以上の処理をユーザーが要求したフォルダ内の全ての文書に対して行い、一覧表示画面を生成する。
図1の画像分割処理部113、オブジェクト属性解析処理部114を説明する。まず、入力された文書画像データに対して画像要素の抽出処理を行う。画像要素の抽出は、入力データが電子データの場合は、文字データがフォントと座標情報等で表されているためビットマップの画像データとは容易に区別することが可能であり、座標情報もデータ中に含まれているため、容易に画像要素の矩形領域情報、属性情報等を抽出することが可能である。
一方、スキャンデータのように全面ビットマップ画像のデータの場合は、OCR処理の前処理等でよく使用される領域の識別処理を行う。例えば、文書画像の背景色を特定し、背景色を用いて該文書画像から背景領域以外の画素を抽出し、該画素を統合して連結成分を生成し、該連結成分を少なくとも形状特徴を用いて所定の領域に分類して、文字や写真を識別する方法(特許文献6を参照)を用いる。また、文字領域識別の他の例として、適応的な2値化処理を行った後、外接矩形の形状を利用して、文字領域を識別する方法(特許文献7を参照)を用いる。
図5は、入力画像データの一例を示し、図6は、図5の画像データの一部分に対して、画像要素抽出処理の結果を示す。図6において、300〜314に示す矩形は、抽出された画像要素を示す。しかし、このように細かい矩形の状態では表示する際にそれ単体では意味をなさないと予想できる。例えば、カメラの周囲に存在している、寸法線(303,302)などの情報はまとめて1つのオブジェクトとして管理した方が扱いやすい。よって、このように分散しているオブジェクト同士を関連付けし、統合することで、単体でも意味をなすことが可能となる。図7は、図6のオブジェクトを必要に応じて統合した結果例を示す。ここでは、カメラの写真周辺に付随している寸法線を同じオブジェクト401として統合した。図7の矩形領域401〜408は各オブジェクトである。他に統合対象として効果的なのは図、表、写真などのキャプションや、注釈などである。
図8は、画像分割処理部における、オブジェクト抽出処理のフローチャートである。ステップ21において、未オブジェクト化の画像要素から最大サイズの画像要素を抽出する。ここでのサイズは、幅と高さの二つの要素を用いるが、両者を足しても良いし、面積として判別しても良い。
ステップ22において、抽出されたオブジェクトの周囲要素から同一オブジェクトに統合するか否かの判定を行う。この判定についての詳細は後述する。
ステップ22において、抽出されたオブジェクトの周囲要素から同一オブジェクトに統合するか否かの判定を行う。この判定についての詳細は後述する。
ステップ23において、全ての要素がオブジェクト化されるまで上記の処理を繰り返し、全てがオブジェクト化された時点で処理を終了する。
図9は、オブジェクト統合化判定処理のフローチャート(ステップ22の詳細)である。
ステップ31において、抽出された画像要素(以下自要素)をオブジェクトとする。この時点ではオブジェクトの矩形領域は自要素と同一となる。ステップ32において、自要素のブロックサイズに応じて、サイズの閾値と距離の閾値を設定する。ステップ33において、最も距離の近い要素を対象要素として抽出する。ステップ34において、対象要素のサイズが閾値以下か否か判定し、閾値よりも大きい場合は同一オブジェクトへの統合をしないように以下の判定処理をとばす。ステップ35において、対象要素との距離が閾値以下か否か判定し、閾値よりも大きい場合は同一オブジェクトへの統合をしないように以下の判定処理をとばす。ステップ36において、自要素と対象要素との相対的な位置関係を検出し、関係が無い場合には、同一オブジェクトへの統合をしないように以下の判定処理をとばす。
ステップ31において、抽出された画像要素(以下自要素)をオブジェクトとする。この時点ではオブジェクトの矩形領域は自要素と同一となる。ステップ32において、自要素のブロックサイズに応じて、サイズの閾値と距離の閾値を設定する。ステップ33において、最も距離の近い要素を対象要素として抽出する。ステップ34において、対象要素のサイズが閾値以下か否か判定し、閾値よりも大きい場合は同一オブジェクトへの統合をしないように以下の判定処理をとばす。ステップ35において、対象要素との距離が閾値以下か否か判定し、閾値よりも大きい場合は同一オブジェクトへの統合をしないように以下の判定処理をとばす。ステップ36において、自要素と対象要素との相対的な位置関係を検出し、関係が無い場合には、同一オブジェクトへの統合をしないように以下の判定処理をとばす。
ここでの位置関係は、両者の2次元的な位置関係を識別するものであり、以下の(1)から(3)の項目中一つでも当てはまる場合、位置的な関係有りと判断する。
(1)2つの要素の中心座標のx,yのいずれかが略同一
(2)2つの要素の端部座標のx,yのいずれかが略同一
(3)自要素の左端から右端のx座標領域内または上端から下端のy座標領域内に対象要素の領域が含まれる。
(1)2つの要素の中心座標のx,yのいずれかが略同一
(2)2つの要素の端部座標のx,yのいずれかが略同一
(3)自要素の左端から右端のx座標領域内または上端から下端のy座標領域内に対象要素の領域が含まれる。
例えば、図6の例では、要素301と303は中心のx座標値が略同一であるため(1)の条件に該当し、また、要素301と306では要素300のx座標領域(要素301の右端から左端の領域)に要素306のx座標領域が含まれるため(3)の条件に該当する。要素301と311では、要素311のサイズ(面積)が大きいため同一オブジェクトには含まれないことになる。
ステップ37において、自要素と対象要素を同一オブジェクトへ統合し、オブジェクトの矩形領域を更新する。ステップ38において、周囲要素に対して処理が終了したか否かを判定し、終了していなければステップ33以下の処理を繰り返す。
統合の際に、属性が文字の矩形と、写真の矩形とが統合される場合も考えられるが、その場合の統合後の属性の決定方法としては、統合対象となるオブジェクトのうち最大サイズの矩形の属性を、統合後の属性とする。
以上のようにして、元画像をオブジェクトに分割し、意味の成立する単位にオブジェクトを統合し、部分画像を再構築し、またその属性情報を判定する。
図1の画像選択処理部116について説明する。上述した方法により、DBに登録されている全画像が処理され、分割画像情報DB117に、分割画像の実態や、その属性情報、サイズ等のメタデータとともに保存されている。メタデータは、例えばDBのメモリ上にテーブルで管理される。各文書毎に、1.文書全体における分割画像の通し番号、2.文書全体に対する開始座標、3.width、height、4.属性情報、5.本オブジェクトデータへのアドレス、6.オリジナルデータへのアドレス、7.文書全体の縮小画像データ(サムネイルデータ)へのアドレス、8.オブジェクト間の関連付け(統合)情報などの情報を記録、管理する。管理するメタデータはこれに限るものではない。
図10は、図6の分割結果のメタデータの管理テーブルの一例を示す。通しNo.1は、図6の要素300のメタデータである。オリジナル画像における開始座標は(100,200)である。ここではpixel値を示す。矩形の幅と高さは(80,1000)である。属性の1はタイトルを示している。オリジナル関連付け情報8に記載した0は、本オブジェクトには関連付けされた統合する他のオブジェクトが無いことを示している。
通しNo.2は、図6の要素301のカメラの写真部分を示している。通しNo.3は、図6の要素302の寸法線を示す。属性は図である。ここで関連付け情報に2とあるのは、通しNo.2のオブジェクトと関連付けられることを示している。同様に通しNo.4は、図6の要素303を示しており、属性は文字であり、No.2のオブジェクトと関連付けされていることを示している。以上のように全ての部分画像(オブジェクト)に対してテーブル上でメタ情報を管理する。
画像選択処理部116は、表示の形態に応じて、上述した分割画像情報DBから部分画像を選択し、その結果は外部I/F111を通じて、クライアント100のアプリケーション102へ送信される。
次に、選択の条件、すなわち表示の形態について説明する。
1.最大サイズの部分画像を表示する
図11は、一文書において最大サイズのオブジェクトを選択する処理フローチャートを示す。この例では、最大サイズとは最大面積を意味する。
1.最大サイズの部分画像を表示する
図11は、一文書において最大サイズのオブジェクトを選択する処理フローチャートを示す。この例では、最大サイズとは最大面積を意味する。
図10に示す、管理されているデータの内、3.オブジェクトの矩形の幅と高さ情報を利用する。tempの初期値は0として、先頭の通しNo.1のオブジェクトからスタートする(ステップ41)。width、heightに現在のオブジェクトの値を入れる(ステップ42)。(width*height)がtempよりも大きい場合には(ステップ43)、tempを更新し、そのオブジェクトNoを記憶する(ステップ44)。以上の処理を、文書中の全オブジェクトに関して行う(ステップ45)。その結果、文書中の最大面積のオブジェクトNoが選択されることになる。
以上の処理をDBに登録されている全文書、あるいはフォルダ内の全文書に対して行う。この処理はクライアントから表示の要求があってから処理するよりも、文書中で最大のオブジェクトを画像登録時に判別して、管理テーブル上に記録しておいてもよい。それにより、最大オブジェクトを判別する処理時間が省かれ、表示の応答速度が向上する。
クライアント100のアプリケーション102上で一覧として表示された結果を図12に示す。ここではPCモニタ504上に6個の文書を表示している。表示倍率は各文書に割りてられている表示枠501の中で最大に表示できる倍率として各画像502を表示している。503は、その画像が含まれているオリジナル画像のファイル名を明記している。この例では、6文書を表示しているが表示文書数はこれに限らない。一度に表示させる文書数を減らして1文書あたりの表示エリアを拡大すれば必然的に個々のオブジェクトの視認性は向上する。
また、対象とするオブジェクトは、図7に示したような統合後のオブジェクトを対象としてもよいし、あるいは図6の統合前のオブジェクトを対象としてもよい。この文書の場合は統合前後に係らず、最大サイズは図7の要素406の写真が選ばれる。
2.所定の属性種の部分画像を表示する。
図13は、文書単位に、属性が写真で、かつ最大サイズのオブジェクトを選択する処理フローチャートを示す。図10に管理されているデータのうち、3.width、height、と4.属性の情報を利用する。入力されたオブジェクトの属性を判定する(ステップ52)。属性が写真のみを表示の対象とするので、属性が写真であるオブジェクトを処理対象として進める。次に、オブジェクトのサイズの判定を行う(ステップ53、54)。サイズの判定処理は図11の処理フローと同様の処理を行えばよい。以上の処理を文書中の全オブジェクトに関して行う(ステップ56)。その結果、文書中の目的とした属性、ここでは写真オブジェクトの最大面積のオブジェクトが選択される。すなわち写真が含まれない元画像は対象から除かれる。
図13は、文書単位に、属性が写真で、かつ最大サイズのオブジェクトを選択する処理フローチャートを示す。図10に管理されているデータのうち、3.width、height、と4.属性の情報を利用する。入力されたオブジェクトの属性を判定する(ステップ52)。属性が写真のみを表示の対象とするので、属性が写真であるオブジェクトを処理対象として進める。次に、オブジェクトのサイズの判定を行う(ステップ53、54)。サイズの判定処理は図11の処理フローと同様の処理を行えばよい。以上の処理を文書中の全オブジェクトに関して行う(ステップ56)。その結果、文書中の目的とした属性、ここでは写真オブジェクトの最大面積のオブジェクトが選択される。すなわち写真が含まれない元画像は対象から除かれる。
以上の処理の結果をDBに登録されている全文書、あるいはフォルダ内の文書に対して行い、クライアントのアプリケーション上で一覧として表示された結果を図14に示す。ここでも先に説明した最大サイズの部分画像の表示例と同様にPCモニタ604上に6個の文書を表示している。表示倍率は各文書に割りてられている表示枠601の中で、最大に表示できる倍率として各画像602を表示している。写真の場合は画像が縮小されていても、その内容の把握が容易であることが多い。よって、この例では6文書を表示しているが、表示文書数はこれに限らず増やしてもよい。603はその画像が含まれているオリジナル画像のファイル名を明記している。
3.各属性種から代表の部分画像を表示する
図13の属性に関する判定ステップ52において、例えば、タイトル、写真、図の3種類に限定し、それぞれについて、図13の処理を行う。3つの属性のうち文書によっては存在しない属性オブジェクトもあるため、1〜3つのオブジェクトが選択される。以上のように選択されたオブジェクトをクライアントの表示端末上で一覧表示の画像として利用する。一覧表示された例を図15に示す。この例では、モニタ701に3つの文書を表示しており、各文書において表示するオブジェクトの表示枠はあらかじめ固定されているものとしている。よってその枠内に最大となるように、各オブジェクトの拡大率が決定されて表示される。703の領域にファイル名を表示し、702の領域にタイトルを表示する。ここでの表示は、図1の分割画像情報DB117に保存されている部分画像をそのまま利用してもよいし、オリジナル画像が電子ファイルである場合は、そのテキストコードを用いて表示してもよい。704は写真オブジェクトとして存在した最大サイズのものが表示されている。同様に、705は図オブジェクトとして存在した最大サイズのものが表示されている。この例では全ての文書に各属性のオブジェクトが存在しているので、図15のように表示できるが、例えば文書中に存在しない属性オブジェクトもある。その場合は、それに割り当てられた表示枠には何も表示しない、または存在している属性から追加して表示してもよい。
図13の属性に関する判定ステップ52において、例えば、タイトル、写真、図の3種類に限定し、それぞれについて、図13の処理を行う。3つの属性のうち文書によっては存在しない属性オブジェクトもあるため、1〜3つのオブジェクトが選択される。以上のように選択されたオブジェクトをクライアントの表示端末上で一覧表示の画像として利用する。一覧表示された例を図15に示す。この例では、モニタ701に3つの文書を表示しており、各文書において表示するオブジェクトの表示枠はあらかじめ固定されているものとしている。よってその枠内に最大となるように、各オブジェクトの拡大率が決定されて表示される。703の領域にファイル名を表示し、702の領域にタイトルを表示する。ここでの表示は、図1の分割画像情報DB117に保存されている部分画像をそのまま利用してもよいし、オリジナル画像が電子ファイルである場合は、そのテキストコードを用いて表示してもよい。704は写真オブジェクトとして存在した最大サイズのものが表示されている。同様に、705は図オブジェクトとして存在した最大サイズのものが表示されている。この例では全ての文書に各属性のオブジェクトが存在しているので、図15のように表示できるが、例えば文書中に存在しない属性オブジェクトもある。その場合は、それに割り当てられた表示枠には何も表示しない、または存在している属性から追加して表示してもよい。
実施例2:
図16は、実施例2のシステム構成を示す。実施例2では、実施例1の構成に、文字認識処理部118を追加する。画像分割処理部113で分割された各画像について文字認識を行う。ここでの処理は、入力画像が電子データの場合は、文字部はもともと文字コード化されているため文字認識処理は基本的に必要ない。入力画像がビットマップデータの場合に文字認識処理が必要となる。文字認識の方法については、一般的なOCR(光学的文字認識)を用いればよい。文字認識処理部118には、画像分割処理部113の結果とオブジェクト属性解析処理部114の結果が入力され、該当するオブジェクトに対して文字認識処理を行う。文字認識結果は分割画像情報DB117へ保存される。管理方法は、図10の管理テーブル上に直接、文字認識結果である文字コードを記録してもよいし、別メモリ上に記憶してそこへアクセス可能なアドレスを管理テーブルに記憶してもよい。
図16は、実施例2のシステム構成を示す。実施例2では、実施例1の構成に、文字認識処理部118を追加する。画像分割処理部113で分割された各画像について文字認識を行う。ここでの処理は、入力画像が電子データの場合は、文字部はもともと文字コード化されているため文字認識処理は基本的に必要ない。入力画像がビットマップデータの場合に文字認識処理が必要となる。文字認識の方法については、一般的なOCR(光学的文字認識)を用いればよい。文字認識処理部118には、画像分割処理部113の結果とオブジェクト属性解析処理部114の結果が入力され、該当するオブジェクトに対して文字認識処理を行う。文字認識結果は分割画像情報DB117へ保存される。管理方法は、図10の管理テーブル上に直接、文字認識結果である文字コードを記録してもよいし、別メモリ上に記憶してそこへアクセス可能なアドレスを管理テーブルに記憶してもよい。
クライアント100では入力デバイス、例えばキーボードにより目的のキーワードを入力する。入力されたキーワードは外部I/F111を経てサーバ110の画像選択処理部116へ送られる。
図17は、文字認識処理を用いた、画像選択の処理フローチャートを示す。既に文字認識処理された結果である文字コードからオブジェクト内にキーワードが含まれるか否かをチェックし(ステップ62)、含まれるオブジェクトの中で最大サイズ(width*height)のものを選ぶ(ステップ63〜65)。ここでは、最大サイズのオブジェクトを1つ表示したが、サイズに関して順位付けをして複数個表示してもよい。
図18は、文字認識処理の対象を所定の属性に限る場合の、画像選択の処理フローチャートを示す。ここでは、OCR対象を図の属性オブジェクトに限定している。この場合の属性種類の限定方法は、表示画面にラジオボタン等でクライアントが入力する手段を設けて、その都度、限定条件を入手してもよいし、アプリケーションの初期条件としてあらかじめ決定しておいてもよい。
上記した実施例1および2において、オブジェクトのサイズ判定に関しては、あらかじめ画像分割処理の際にサイズやサイズによる文書内での順位などを算出し、管理テーブルに記録しておいてもよい。
文字部を表示する際に、限られた表示領域の中に、所定の画像サイズのものを表示しようとすると、場合によっては文字が判読不可能となる場合もある。判読不可能な状態では、オリジナル画像にアクセスし、文書全体を展開しないと文書内容が確認できないことになる。
そこで、オリジナル画像にアクセスしなくても文書内容を確認可能とするために、文字オブジェクトの表示倍率を判読可能な倍率に制御する。通常のCRTおよびLCDを表示媒体としたとき、それらの解像度は100dpi程度である。また、画面上で文字を判読できる大きさとしては1文字2mm程度である。100dpiのモニタで2mmの文字は約8dot程度で構成される。よって、100dpiのモニタをクライアントが使用している場合は、1文字を8dotで表示すれば判読可能となる。図16のクライアント100において、表示するアプリケーション102は、接続している表示デバイス101の解像度情報を入手する。また、サーバ側では、文字認識処理部118が、文字の大きさに相当する、文字の高さまたは幅をpixel数で取得しておく。オブジェクト内に存在している文字は基本的には同じ文字サイズであるからオブジェクトとしての文字サイズを図10の管理テーブルに追加して管理する。クライアント100のアプリケーション102は表示する文字オブジェクトの文字サイズ(pixel)とモニタの解像度から、表示倍率を算出する。
表示における拡大率は、以下の式により算出できる。
拡大率=モニタ解像度/25.4*2/オブジェクトの文字サイズ
25.4:1インチ=25.4mm
2 :表示したい文字サイズ(mm)
オブジェクトの文字サイズ:オブジェクト(画像)の文字サイズ(pixel)
このように拡大して文字オブジェクトを表示すると、モニタ上の表示枠の範囲内にオブジェクト全体が収まらない可能性もある。表示例を図19に示す。説明の都合上1つのファイルだけを図示しているが、実際は図15と同様に3文書表示されているものとする。802は表示する文字オブジェクトを示している。図に示した802の矩形の大きさは、表示モニタ801に表示する場合に、上記算出式で計算された拡大率で表示したときの大きさである。このままでは表示枠803には収まらない。表示方法は種々あるが、例えば表示例1のように枠内のみの表示とし、オブジェクトの左上部だけを表示する。または、表示例2のように、全体を画面上にポップアップさせて表示するが、表示方法はこれに限らない。
拡大率=モニタ解像度/25.4*2/オブジェクトの文字サイズ
25.4:1インチ=25.4mm
2 :表示したい文字サイズ(mm)
オブジェクトの文字サイズ:オブジェクト(画像)の文字サイズ(pixel)
このように拡大して文字オブジェクトを表示すると、モニタ上の表示枠の範囲内にオブジェクト全体が収まらない可能性もある。表示例を図19に示す。説明の都合上1つのファイルだけを図示しているが、実際は図15と同様に3文書表示されているものとする。802は表示する文字オブジェクトを示している。図に示した802の矩形の大きさは、表示モニタ801に表示する場合に、上記算出式で計算された拡大率で表示したときの大きさである。このままでは表示枠803には収まらない。表示方法は種々あるが、例えば表示例1のように枠内のみの表示とし、オブジェクトの左上部だけを表示する。または、表示例2のように、全体を画面上にポップアップさせて表示するが、表示方法はこれに限らない。
図1または図16のシステム構成において、クライアント側から表示の形態を選択することもできる。アプリケーション上で表示形態を選択できる手段、例えばラジオボタンを設けて以下の選択肢から選ぶ。
(1)最大オブジェクト1つを表示する(図12)
(2)所定の属性オブジェクトを表示する(図14)
(3)存在する属性から各1つずつ表示する(図15)
(4)文字を拡大表示する(枠内表示または枠外表示)(図19)
(4)の文字の拡大表示に関してはON/OFとして、実際の表示形態としては(1)〜(3)の中で選択してもよい。フォルダに保存されている文書種類によっては、(1)〜(3)の中で適切なものとそうでないものがある。例えば、(2)の表示方法は選択した属性オブジェクトが存在していない文書は一覧から除外されてしまうため、フォルダ内に様々なタイプの文書が雑多に入っているような場合は不向きであるが、ユーザーが写真から探したい場合には、(2)は有効である。このようにユーザーの要求に対応して適切な表示を選択することができる。この表示形態の切り替えは、アプリケーション上で一覧表示のたびに切り替えてもよいし、初期設定で設定してもよい。
(1)最大オブジェクト1つを表示する(図12)
(2)所定の属性オブジェクトを表示する(図14)
(3)存在する属性から各1つずつ表示する(図15)
(4)文字を拡大表示する(枠内表示または枠外表示)(図19)
(4)の文字の拡大表示に関してはON/OFとして、実際の表示形態としては(1)〜(3)の中で選択してもよい。フォルダに保存されている文書種類によっては、(1)〜(3)の中で適切なものとそうでないものがある。例えば、(2)の表示方法は選択した属性オブジェクトが存在していない文書は一覧から除外されてしまうため、フォルダ内に様々なタイプの文書が雑多に入っているような場合は不向きであるが、ユーザーが写真から探したい場合には、(2)は有効である。このようにユーザーの要求に対応して適切な表示を選択することができる。この表示形態の切り替えは、アプリケーション上で一覧表示のたびに切り替えてもよいし、初期設定で設定してもよい。
上記した実施例はクライアントPCモニタ上での表示を例に説明したが、MFPの操作パネルや、その他表示デバイスでも実現可能である。
100 クライアント装置
101 表示デバイス
102 アプリケーションプログラム
103 入力デバイス
104 外部通信路
110 サーバ装置
111 外部I/F
112 画像DB制御部
113 画像分割処理部
114 オブジェクト属性解析処理部
115 画像DB
116 画像選択処理部
117 分割画像情報DB
101 表示デバイス
102 アプリケーションプログラム
103 入力デバイス
104 外部通信路
110 サーバ装置
111 外部I/F
112 画像DB制御部
113 画像分割処理部
114 オブジェクト属性解析処理部
115 画像DB
116 画像選択処理部
117 分割画像情報DB
Claims (20)
- 画像を部分画像に分割する画像分割手段と、該分割された部分画像の属性を判定する属性判定手段と、前記画像分割手段の分割結果に基づいて、または前記画像分割手段の分割結果および前記属性判定手段の属性判定結果に基づいて複数の部分画像を選択する画像選択手段と、前記選択された部分画像を所定の表示領域に表示する表示手段とを有することを特徴とする画像表示装置。
- 前記画像選択手段は、前記分割された部分画像の内、画像サイズが最大のものを選択することを特徴とする請求項1記載の画像表示装置。
- 前記画像選択手段は、前記属性判定手段により判定された部分画像の内、所定の属性種の画像を選択することを特徴とする請求項1記載の画像表示装置。
- 前記画像選択手段は、前記属性判定手段により判定された各属性種から代表の部分画像を選択することを特徴とする請求項1記載の画像表示装置。
- キーワードを入力する手段と、文字認識する手段とを有し、前記画像選択手段は、前記キーワードと一致する文字列を含む部分画像を選択することを特徴とする請求項1記載の画像表示装置。
- 前記画像選択手段は、選択する対象を所定の属性種に限定することを特徴とする請求項5記載の画像表示装置。
- 前記分割結果と前記属性判定結果に基づいて部分画像間に関連付けする画像関連付け手段を有し、前記関連付け手段により関連付けされた結果と前記分割結果および属性判定結果に基づいて複数の部分画像を選択する画像選択手段と、前記選択された部分画像を所定の表示領域に表示する表示手段とを有することを特徴とする請求項1記載の画像表示装置。
- 前記表示手段は、文字を有する部分画像において文字が判読可能な倍率を算出する手段を有し、該算出された倍率で表示することを特徴とする請求項1または7記載の画像表示装置。
- 表示形態を選択する手段を有し、前記画像選択手段は選択された表示形態に基づいて画像を選択することを特徴とする請求項1乃至8のいずれか1項に記載の画像表示装置。
- 画像を部分画像に分割する画像分割工程と、該分割された部分画像の属性を判定する属性判定工程と、前記画像分割工程の分割結果に基づいて、または前記画像分割工程の分割結果および前記属性判定工程の属性判定結果に基づいて複数の部分画像を選択する画像選択工程と、前記選択された部分画像を所定の表示領域に表示する表示工程とを有することを特徴とする画像表示方法。
- 前記画像選択工程は、前記分割された部分画像の内、画像サイズが最大のものを選択することを特徴とする請求項10記載の画像表示方法。
- 前記画像選択工程は、前記属性判定工程により判定された部分画像の内、所定の属性種の画像を選択することを特徴とする請求項10記載の画像表示方法。
- 前記画像選択工程は、前記属性判定工程により判定された各属性種から代表の部分画像を選択することを特徴とする請求項10記載の画像表示方法。
- キーワードを入力する工程と、文字認識する工程とを有し、前記画像選択工程は、前記キーワードと一致する文字列を含む部分画像を選択することを特徴とする請求項10記載の画像表示方法。
- 前記画像選択工程は、選択する対象を所定の属性種に限定することを特徴とする請求項14記載の画像表示方法。
- 前記分割結果と属性判定結果に基づいて部分画像間に関連付けする画像関連付け工程を有し、前記関連付け工程により関連付けされた結果と前記分割結果および属性判定結果に基づいて複数の部分画像を選択する画像選択工程と、前記選択された部分画像を所定の表示領域に表示する表示工程とを有することを特徴とする請求項10記載の画像表示方法。
- 前記表示工程は、文字を有する部分画像において文字が判読可能な倍率を算出する工程を有し、該算出された倍率で表示することを特徴とする請求項10または17記載の画像表示方法。
- 表示形態を選択する工程を有し、前記画像選択工程は選択された表示形態に基づいて画像を選択することを特徴とする請求項10乃至17のいずれか1項に記載の画像表示方法。
- 請求項10乃至18のいずれか1項に記載の画像表示方法をコンピュータに実現させるためのプログラム。
- 請求項10乃至18のいずれか1項に記載の画像表示方法をコンピュータに実現させるためのプログラムをコンピュータに実現させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006227873A JP2008052496A (ja) | 2006-08-24 | 2006-08-24 | 画像表示装置、画像表示方法、プログラムおよび記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006227873A JP2008052496A (ja) | 2006-08-24 | 2006-08-24 | 画像表示装置、画像表示方法、プログラムおよび記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008052496A true JP2008052496A (ja) | 2008-03-06 |
Family
ID=39236499
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006227873A Pending JP2008052496A (ja) | 2006-08-24 | 2006-08-24 | 画像表示装置、画像表示方法、プログラムおよび記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008052496A (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8358875B2 (en) | 2008-10-31 | 2013-01-22 | Fuji Xerox Co., Ltd. | Image display device, image display method, and computer readable medium |
WO2013069125A1 (ja) * | 2011-11-10 | 2013-05-16 | 三菱電機株式会社 | 地図データ変換方法、記憶媒体、地図表示装置 |
WO2013069124A1 (ja) * | 2011-11-10 | 2013-05-16 | 三菱電機株式会社 | 地図表示装置 |
US8482808B2 (en) | 2008-09-17 | 2013-07-09 | Konica Minolta Business Technologies, Inc. | Image processing apparatus and method for displaying a preview of scanned document data |
JP2013219582A (ja) * | 2012-04-10 | 2013-10-24 | Konica Minolta Inc | 画像形成装置およびプログラム |
US9554006B2 (en) | 2014-10-30 | 2017-01-24 | Kyocera Document Solutions Inc. | Information processing apparatus, image forming apparatus, and processing image selection method |
JP2022033817A (ja) * | 2018-01-23 | 2022-03-02 | キヤノン株式会社 | スキャン画像に関連する情報を設定するための装置、方法、およびプログラム |
-
2006
- 2006-08-24 JP JP2006227873A patent/JP2008052496A/ja active Pending
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8482808B2 (en) | 2008-09-17 | 2013-07-09 | Konica Minolta Business Technologies, Inc. | Image processing apparatus and method for displaying a preview of scanned document data |
US8358875B2 (en) | 2008-10-31 | 2013-01-22 | Fuji Xerox Co., Ltd. | Image display device, image display method, and computer readable medium |
WO2013069125A1 (ja) * | 2011-11-10 | 2013-05-16 | 三菱電機株式会社 | 地図データ変換方法、記憶媒体、地図表示装置 |
WO2013069124A1 (ja) * | 2011-11-10 | 2013-05-16 | 三菱電機株式会社 | 地図表示装置 |
JP5677587B2 (ja) * | 2011-11-10 | 2015-02-25 | 三菱電機株式会社 | 地図表示装置 |
JPWO2013069125A1 (ja) * | 2011-11-10 | 2015-04-02 | 三菱電機株式会社 | 地図データ変換方法、記憶媒体、地図表示装置 |
JP2013219582A (ja) * | 2012-04-10 | 2013-10-24 | Konica Minolta Inc | 画像形成装置およびプログラム |
US9554006B2 (en) | 2014-10-30 | 2017-01-24 | Kyocera Document Solutions Inc. | Information processing apparatus, image forming apparatus, and processing image selection method |
JP2022033817A (ja) * | 2018-01-23 | 2022-03-02 | キヤノン株式会社 | スキャン画像に関連する情報を設定するための装置、方法、およびプログラム |
JP7150967B2 (ja) | 2018-01-23 | 2022-10-11 | キヤノン株式会社 | スキャン画像に関連する情報を設定するための装置、方法、およびプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3024213B1 (en) | Image scanning apparatus and method for controlling the same | |
US8001466B2 (en) | Document processing apparatus and method | |
US8482808B2 (en) | Image processing apparatus and method for displaying a preview of scanned document data | |
US9060085B2 (en) | Image forming apparatus, electronic mail delivery server, and information processing apparatus | |
US7610274B2 (en) | Method, apparatus, and program for retrieving data | |
US8612429B2 (en) | Apparatus, system, and method for information search | |
US20120072833A1 (en) | Host apparatus and screen capture control method thereof | |
JP2006120125A (ja) | ドキュメント画像情報管理装置及びドキュメント画像情報管理プログラム | |
JP2007286864A (ja) | 画像処理装置、画像処理方法、プログラムおよび記録媒体 | |
US20140250375A1 (en) | Method and system for summarizing documents | |
JP2007286767A (ja) | 画像検索システム、及び、画像検索サーバ及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体 | |
US7475362B2 (en) | Information processing apparatus, file processing method, and computer-readable memory medium and program | |
JP2008052496A (ja) | 画像表示装置、画像表示方法、プログラムおよび記録媒体 | |
JP2007317034A (ja) | 画像処理装置、画像処理方法、プログラムおよび記録媒体 | |
US11137946B2 (en) | Image processing apparatus, method for controlling the same and storage medium | |
JP6262708B2 (ja) | 深い検索性を有するオブジェクト化及びハードコピーからオリジナルの電子ファイルを検出するドキュメント検出方法 | |
US8582148B2 (en) | Image processing apparatus and image processing method | |
JP2008040753A (ja) | 画像処理装置、方法、プログラムおよび記録媒体 | |
US9798724B2 (en) | Document discovery strategy to find original electronic file from hardcopy version | |
US11223731B2 (en) | Image processing apparatus, method for controlling the same and storage medium | |
JP2004214991A (ja) | 文書画像データ管理システム、文書画像データ管理プログラム、文書画像データ管理装置及び文書画像データ管理方法 | |
US20090287692A1 (en) | Information processing apparatus and method for controlling the same | |
JP6614045B2 (ja) | 画像形成装置、プログラム及び情報処理システム | |
JP4391157B2 (ja) | 文書処理装置、文書処理方法、文書処理プログラム、および記録媒体 | |
JP2001101213A (ja) | 情報処理装置、ドキュメント管理装置、情報処理システム、情報管理方法、及び記憶媒体 |