JP5423422B2 - 画像処理装置、画像処理方法、プログラム及び記録媒体 - Google Patents

画像処理装置、画像処理方法、プログラム及び記録媒体 Download PDF

Info

Publication number
JP5423422B2
JP5423422B2 JP2010012330A JP2010012330A JP5423422B2 JP 5423422 B2 JP5423422 B2 JP 5423422B2 JP 2010012330 A JP2010012330 A JP 2010012330A JP 2010012330 A JP2010012330 A JP 2010012330A JP 5423422 B2 JP5423422 B2 JP 5423422B2
Authority
JP
Japan
Prior art keywords
image
representative
images
thumbnail
processing apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010012330A
Other languages
English (en)
Other versions
JP2011151674A (ja
Inventor
潤一 原
純一 山形
多聞 貞末
宏幸 作山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2010012330A priority Critical patent/JP5423422B2/ja
Publication of JP2011151674A publication Critical patent/JP2011151674A/ja
Application granted granted Critical
Publication of JP5423422B2 publication Critical patent/JP5423422B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Editing Of Facsimile Originals (AREA)

Description

本発明は、文書ファイルのサムネイルを生成する処理に関し、より詳しくは、複数枚の画像よりなる文書ファイルのなかから選定された代表画像をもとに文書ファイルのサムネイル画像を生成する処理を行う画像処理装置、画像処理方法及び前記サムネイル画像の生成機能を実現するためのプログラムに関する。
従来から、画像処理装置において文書ファイルをアクセスする際にユーザーが目的のファイルを見つけ出し指示する操作を容易にする等の手段として、文書ファイルのサムネイルが利用されている。その中には、複数枚の原稿をスキャン読み取りして得られる文書ファイルにサムネイルを利用したものもある。この場合、文書ファイルがスキャン読み取り順に連ねた所定フォーマットの複数ページ(枚)の画像データで構成されるので、文書ファイルのサムネイル或いはアイコンとして、最初のページである表紙を用いるものが多い。
複数枚よりなる文書ファイルのサムネイルに表紙のような1枚の画像を用いる方法では、上記複数枚の画像よりなる文書ファイルが多数蓄積された場合に、表紙をもとにユーザーの不確かな記憶を頼りに目的のファイルやどこかのファイル中にあるはずの目的の画像を探すことは、困難を伴う。例えば、写真などを保持するCD(Compact Disc)−R(Recordable)等は単にタイトルを表示することや1枚の画像を表示することでは、CD―R中に保存されているそれぞれの画像の特定は難しく、不明瞭な記憶を頼りに捜すことは殆ど不可能に近かった。
このため、特許文献1では、撮影日の情報が付与された画像データを所定数のグループに分類し、各グループからそれぞれ1つの画像データを選択し、この画像によってグループごとのサムネイル画像データを生成する。また、生成したサムネイル数個をこの画像データが記録されたDVD(Digital Versatile Disc)‐R(Recordable)の盤面にプリントする。このように、特許文献1は、DVD‐Rの盤面にタイトルだけではなく、上記の方法で生成したサムネイル画像をプリントすることでDVD‐R中の内容の特定をより容易にするものである。
ただ、上記の従来技術を論文や社内文書などのような定型文書に適用した場合、例えば表紙のレイアウトが同じであるため、それらの文書のカテゴリーの絞り込みが行える程度で、それ以上の文書内容による絞込みは困難である。
画像検索を容易にするサムネイルの生成処理を行う特許文献2では、各画像を予め決められた数個のカテゴリーに分けて、近い画像同士をサムネイル一覧画面上で近くに配置することで検索の利便性を増す発明である。この発明により、似た画像が近くに配置され、同じような画像を検索するのが容易になる。
ただ、この発明をテキスト文書のみの画像に適用すると、1つのカテゴリーに全ての画像が集まってきてしまうため、文書単位で人間が目視で捜す場合には不向きである。また、複数枚の画像よりなる文書ファイルへの適用を考慮していないので、このような文書ファイルを目視で検索する場合にも不向きである。
ところで、人間が本を検索するときには、各ページをパラパラと高速でめくって複数ページを同時に目視可能な状態で検索することがある。このようなパラパラめくり検索は、文書中の特徴部分について何らかの知識を予め持っていることを前提に、この知識に基づいて、その特徴部分を手がかりに目的の文書を捜すときの検索方法である。
こうした本のパラパラめくりをコンピュータによって実現しようとすれば、画面上で本のパラパラめくりをエミュレートしてやること、つまり動画で表示してやることが必要になってくると推測される。本のパラパラめくり効果があるサムネイルを作成するのには、サムネイルの表示にこのパラパラめくり動画を用いることにより実現の可能性はある。ただ、このパラパラめくりを効果的に行うためには、高速に画面が切り替わる表示デバイスが必要となってくる。
文書画像を表示するデバイスとして、電子ペーパが近年脚光をあびており、Amazon.comの電子書籍専用端末「キンドル(登録商標)」など、実際に電子ペーパを用いた商品が販売されている。この電子ペーパについて、現在問題になる点は、表示を行うのに何度も書き込みを行わないとはっきりとした画像が表示されない、つまり、画面の書き換え速度が遅いことにある。カラー画像を表示する電子ペーパはさらに画面の書き換え速度が遅く、現状では、動画を表示するデバイスには不向きである。つまり、電子ペーパでは、先に述べた動画によるパラパラめくり検索を直ちに行うことは不可能である。
本発明は、複数枚の画像よりなる文書ファイルの検索技術における上述の現状に鑑みてなされたもので、その目的は、文書の最初のページをサムネイル画像とする、といったような単に1枚の代表画像をサムネイルとして用いるよりも優れた検索性能が得られ、かつ人間によるパラパラめくり検索に相当する検索性能を実現でき、複数枚の画像よりなる文書ファイルの目視による検索を的確かつ容易に行うことを可能にするサムネイル画像を生成することにある。
本発明は、複数枚の画像よりなる文書ファイルの該画像から代表画像を選定する画像選定部及び前記画像選定部によって選定された代表画像をもとに前記文書ファイルのサムネイル画像を生成するサムネイル生成部を有する画像処理装置であって、前記画像選定部は、画像属性に係る特徴によって代表画像を選定する手段であり、前記サムネイル生成部は、前記画像選定部によって選定された代表画像がファイルフォーマット上近接した関係にあることを条件に該代表画像同士を重ね合わせて1枚のサムネイル画像を生成する画像合成手段を備えることを特徴とする。
本発明は、複数枚の画像よりなる文書ファイルの該画像から代表画像を選定する画像選定工程及び前記画像選定工程で選定された代表画像をもとに前記文書ファイルのサムネイル画像を生成するサムネイル生成工程を有する画像処理方法であって、前記画像選定工程は、画像属性に係る特徴によって代表画像を選定する工程であり、前記サムネイル生成工程は、前記画像選定工程で選定された代表画像がファイルフォーマット上近接した関係にあることを条件に該代表画像同士を重ね合わせて1枚のサムネイル画像を生成する画像合成工程を有することを特徴とする。
本発明より生成されるサムネイル画像(疑似パラパラ画像)を用いることで、文書の最初のページをサムネイル画像とする、といったような単に1枚の代表画像をサムネイルとして用いる従来技術に比べ、複数枚の画像よりなる文書ファイルの目視による検索をより的確かつ容易に行うことができる。
文書ファイルの代表画像の1例(A)と選定された代表画像をもとに生成されるサムネイル画像(疑似パラパラ画像)の1例(B)を示す図である。 互いに近接した関係にある代表画像の1例を示す図である。 図2に示した代表画像の合成画像(疑似パラパラ画像)を示す図である。 本発明の画像処理装置の実施形態に係るハードウェア構成を示すブロック図である。 本発明の実施形態に係るサムネイル画像の生成処理フローの概略図である。 本発明の実施形態に係る代表画像の選定部の1例を示すブロック図である。 本発明の実施形態に係る代表画像の選定処理フローの1例を示す図である。 本発明の実施形態に係る代表画像の合成処理フローの1例を示す図である。 本発明の実施形態に係る合成画像の他の例を示す図である。 本発明の実施形態に係るサムネイル画像の生成処理フローの概略図である。 近接画像の線形和による合成画像の1例を示す図である。
本発明の実施形態について、添付図面を参照して説明する。
以下に示す本発明に係る画像処理装置の実施形態は、紙を媒体とする複数枚の文書からスキャナ読取りを通して得た複数枚の画像を、読み取り順に所定のフォーマットのもとにファイル化し、得られる文書ファイルを用いて印刷、画面表示などの画像出力処理を行う画像処理装置(図2、参照)に実施した例を示す。ただ、本実施形態の画像処理装置は、文書ファイルを用いた印刷などの画像出力処理自体を特徴とするわけではなく、文書ファイルのサムネイル画像の生成処理を特徴とする。文書ファイルのサムネイルは、画像出力などの処理に用いるために蓄積された文書ファイルと対応付けて登録され、文書ファイルにアクセスする際にユーザーが目指す文書ファイルを蓄積ファイル群から見付け出し、処理対象として指示する操作を容易に行うために利用される一種のアイコンである。
「複数代表画像によるサムネイル画像(疑似パラパラ画像)」
複数枚の画像よりなる文書ファイルのサムネイル画像は、従来、各文書ファイルに対し1枚の代表画像を用いていたために、上記[背景技術]で述べたように、文書ファイルの画像の種類によっては目視による検索が困難になり、検索性能の低下は否めない。
そこで、本実施形態の画像処理装置が行う文書ファイルのサムネイルの生成処理は、文書を構成する画像がそれぞれ持つ画像属性、即ち画像そのものの性質(例えば、文字、図形、写真などの画像種類、カラーとモノクロの画像種別、等)、に係る特徴によって代表画像を選定し、選定された代表画像同士を重ね合わせて1枚のサムネイル画像を生成する。
図1は、代表画像(A)とサムネイル画像(B)の1例を示す図である。図1(A)の画像は、サムネイル生成処理の対象となる文書画像から選定された代表画像の1枚を示す。従来技術においては、図1(A)に示す代表画像1枚をサムネイル画像として登録し、利用していた。
本実施形態では、図1(A)に示す代表画像は、選定された代表画像のうちの1枚で、選定される他の代表画像と重ね合わせる合成処理を経て、サムネイル画像(B)として生成される。
このように本実施形態では、代表画像は、従来技術で定めた1枚という制限を設けずに、それぞれの画像がもつ画像属性に係る特徴によって複数の代表画像を選定し、合成することによって1枚のサムネイル画像とする。これは、人が本などの複数枚の文書から目指す画像の載ったページを目視で見付ける場合に、パラパラと行う速めくりによって認識し、記憶に残る画像を想定したもので、このようにして記憶に残る画像に相当する1枚の画像(以下「疑似パラパラ画像」という)を複数の代表画像を用いて生成し、サムネイル画像として用いる。
なお、ここで生成する疑似パラパラ画像は、サムネイル画像を用いて行う検索をユーザーが目視で行うことを想定すれば、実際に本などの文書を速めくりしたときに目に見える状態とほぼ同じ状態で画像を生成することが、脳の中にある漠然としたイメージによる検索に効果がある。従って、こうした状態に近づけることを後述する疑似パラパラ画像に用いる代表画像の選定方法や代表画像の合成方法において考慮することにより、この効果を高めることができる。
図2は、疑似パラパラ画像を生成するために用いる複数の代表画像(A1)〜(A4)を例示し、図3は、図2の代表画像を用いて生成される疑似パラパラ画像を示す図である。
図2に示す代表画像は、文書を構成する複数の画像のなかから画像属性に係る特徴などの後述する選定条件に従いこの文書の代表画像として選ばれた画像である。
図3の疑似パラパラ画像は、図2に示す4枚の代表画像を合成して生成しているが、文書を構成する画像及び選定条件によっては、必ずしも図2のように複数の代表画像が得られるとは限らない。このような場合、代表画像同士を重ね合わせたサムネイル画像を得るという条件を優先させて、例えば、少なくとも複数の代表画像が選定できるように、選定条件を適応させる方法をとることが可能である。
「疑似パラパラ画像の生成原理」
上記したサムネイル画像として用いる疑似パラパラ画像の生成原理について、ここで説明する。
疑似パラパラ画像は、上述のように、本などの文書を速めくりしたときに目に見える状態とほぼ同じ状態で画像を生成することを目標としているので、この疑似パラパラ画像に用いる画像は、対象とする文書ファイルから一見して記憶に残る特徴を持つ画像を代表画像として選定することが条件となる。
多数枚からなる文書では、文書中の特異な部分が目に付きやすく、このような部分を有する画像を複数枚の画像よりなる文書ファイル中から代表画像として選出する方が目視検索には有効である。
例えば、テキストが多い文書では、その文書中のイラストなどの図形や写真を有するページを代表画像とすることが有効である。逆に、イラストなどの図形が多い文書では、例えば写真集や画像カタログなどの文書では、テキストを多く含んだものを代表画像とする方法を採用すると良い。この場合、イラスト、図形、写真などの画像領域と文字領域を識別し、その割合の比率値を画像の特徴値として用いる。
また、画像の大きさ比率を用いて面積が大きな画像(例えば、大文字で記されるタイトルや大きな図形、写真など)や色味で分類された画像によって、特異な部分を判断し、代表画像の選定をしても良い。さらにこの方法を用いて、各特徴量から代表画像を選ぶ際、幾つかの画像において特徴量の値が同様な値が続くようなときに、その特徴量が大きく変わる変わり目にある画像中から代表画像を選ぶ。選び方としては、特徴量の変わり目の最初の方にある画像や、変わり目にあるなかの例えば、図形が大きな画像などを選び出す。
ここで代表画像として選ぶ基準の特徴量の計算方法やその選び方は、対象文書によって変わるため、実験的に確認した値を適用する等によって対処可能である。また、上記以外にも、特異な部分があるか否かを判断可能な既存の技術を適用することにより実施することができる。
上記の選定条件に従い選ばれた代表画像は、サムネイル画像としての疑似パラパラ画像の構成要素として用いることができる。ただ、本実施形態では、選定された代表画像から疑似パラパラ画像に用いる画像をさらに、画像同士の関連性に基づいて数枚に絞り込み、合成処理の対象とする。
画像同士の関連性とは、例えば、代表画像Aと代表画像Bが文書ファイル中で近接したもの、つまり代表画像Aと代表画像Bとの間にある画像数が少ないもの、例えば、8ページ以内の画像を採用する。
画像同士が近接した関係にあることを条件とした理由は、近接しているほど文書内容の関連性も強いので、これらの画像からの連想が働きやすく、ユーザーが容易に目指す文書であるか否かを判断することが可能になる。
上記の選定方法で合成処理の対象を定め、これらの代表画像を合成し1枚の疑似パラパラ画像を生成する。
ここで行う画像の合成には、単に画像の重ね合わせ(線形合成)を行う処理や、それぞれをある透過率で透かして合成する方法が適用可能である。ただ、比較的近いページ画像を単に線形合成すると、例えば、図11に示すような画像になる。同図に示す画像は、検索時に人間の目には重要度が低い部分をも均等に線形和を行ってしまい、重要度の高い部分の情報を見え難くするため、実用性は低い。上述の近接する代表画像にこの線形合成を用いて疑似パラパラ画像の生成を行っても、やはり特徴部分を見え難くするという問題が生じるため、合成された画像を用いて目指す文書内容の画像を捜すときには、特徴画像が視覚し難くなってしまい、目視による検索には不向きである。
そこで、代表画像として選定された画像において、選定の拠り所となった特徴部分の領域、例えばイラスト領域やタイトル領域などは強調して合成画像を生成すると、視覚的に目立つため、頭の中のイメージを用いて目視検索するときなどに効果があり、頭の中のイメージ無しに文書中の内容を推定するときにも、過去の他の文書を見たときの経験から得られる文書に類似する文書であることが認識できることがあり、この場合には、その文書の内容を推定することが可能になる。
特徴部分を強調するには、疑似パラパラ画像の生成の際に、画像中の小さい文字などは視覚的には重要ではないため、例えば、大きな図や表を中心に合成していく。特徴部分を強調する合成方法の単純な例としては、まず小さな文字ラインを合成する画像中で合わせて、1枚の合成画像上に置く。この際に合成されたライン画像をぼかしてもよい。その次に、各代表画像の特徴量を次々に置いていくが、特徴量の小さいものから順に置き、後に置くほど、例えば濃度や色などを選ぶことにより目立つ画像とする。この操作を行う際、例えば単純に面積比率などを用いたために、文書の章タイトルの特徴量が低い値となっても、そのタイトルを合成画像上に置く順序を後にすることもでき、こうした手順でタイトル内容による文書の特定をし易くする。この処理操作により、本を速めくりして検索するときに目視できる画像内容をサムネイル画像中に表示できる。
「画像処理装置の構成」
図4は、本実施形態に係る画像処理装置のハードウェア構成を示すブロック図である。
この画像処理装置は、バス1と、それぞれがバス1に接続されたCPU(Central Processing Unit)2、メモリ3、通信装置4、表示装置5、HD(Hard Disk)ドライブ6、入力装置7、CD(Compact Disk)−ROM(Read Only Memory)ドライブ8、FD(Flexible Disk)ドライブ9及びIF(インターフェース)15を備えている。
CPU2は、この画像処理装置の動作制御を行うものである。メモリ3は、CPU2が起動時に実行するプログラムや必要なデータ等を記憶するためのROM(Read Only Memory)、CPU2のワークエリア等を構成するためのRAM(Random Access Memory)などからなる。
CPU2は、RAMをワークメモリとして用いることにより、ROM、HDドライブ6などに格納されたソフトウェア(プログラム)を動作させ、これらの要素で構成するコンピュータを動作制御部として機能させる。このコンピュータは、本実施形態では、複数枚の画像よりなる文書ファイルのサムネイル生成処理を実行するためのプログラムを駆動することにより、これらの処理手段として機能する。
通信装置4は、この画像処理装置をインターネットなどの通信回線に接続し、外部の画像処理装置などとのデータ交換を行うための装置である。
表示装置5は、液晶ディスプレイなどからなり、この画像処理装置を操作するための画面や動作状態を表示する。
入力装置7は、キーボードやマウスなどからなり、この画像処理装置に対する種々のキー操作や指示の入力を行うためのものである。
HDドライブ6は、種々のアプリケーションプログラム、ワークデータ、及びファイルデータなどを記憶する。CD−ROMドライブ8は、CD−ROMやDVD−ROMなどの記録媒体の読み出しを行うための装置である。FDドライブ9は、フレキシブルディスクに対する書き込み及び読み出しを行うための装置である。
IF15は、接続する外部デバイス(周辺機器)との間でデータをやり取りするための装置であり、この実施形態では画像処理装置(システム)を構成するので、スキャナ、プリンタ等の外部デバイス16がこのIF15を介して接続される。
「疑似パラパラ画像の生成処理」
本実施形態の画像処理装置(システム)100(図4)が行う疑似パラパラ画像(サムネイル画像)の生成処理について説明する。
図5は、本実施形態に係る疑似パラパラ画像の生成処理フローの概略図である。
図5の処理のフローに従い、画像処理装置(システム)100(図4)が行う疑似パラパラ画像の生成処理を説明する。
画像処理装置100のCPU2は、例えば、原稿がスキャナ読取りされ、作成された文書ファイルをHDに蓄積し、管理するときに、この文書ファイルに対して疑似パラパラ画像の生成処理を実行するプログラムを起動する。なお、上記の処理対象の文書ファイル、文書ファイルの入力方法、処理の実行タイミングは、1例を示すものであり、この例に限る趣旨ではない。
疑似パラパラ画像の生成処理を開始すると、まず、文書ファイルを構成する複数枚の画像それぞれの特徴量を計算する(ステップS101)。
ここで処理の対象となる文書ファイルは、複数枚(ぺ一ジ)の画像が所定のフォーマットのもとに決められた順序で(スキャナ入力画像の場合、読み取り順で)ファイル化された1文書ファイルである。この文書ファイルは、例えば、マルチ画像TIFF(Tagged Image File Format)やPDF(Portable Document Format)などのファイルである。また、計算する特徴量は、画像属性(文字、図形、写真などの画像種類、カラーとモノクロの種別、等)に係る特徴の量的表現であり、ファイルを構成する複数枚の画像それぞれに算出される。これらの特徴量の算出方法自体は、既存の技術を適用することにより実施することができる。
次に、ステップS101で文書ファイルの各画像について算出した特徴量をもとに代表画像を選定する(ステップS102)。代表画像の選定は、上記「疑似パラパラ画像の生成原理」において述べた選定方法に従って、特徴量に基づく選定を行う。
また、上記のようにして選定された代表画像について、画像同士が近接した関係にあることを条件に絞り込みを掛け、疑似パラパラ画像に用いる代表画像(図2参照)を選定する。
ステップS102で選定された近接した関係にある代表画像同士を上記「疑似パラパラ画像の生成原理」において述べた合成方法に従って合成し、1枚の疑似パラパラ画像をサムネイル画像として生成する(ステップS103)。
上記したステップS101〜S103を実行することにより、基本的な疑似パラパラ画像(図3参照)の生成処理を完了し、この処理フローを終了する。
ここで、代表画像を選定する処理の実施例を2例示す。
1つは、画像の種類が異なるテキストと非テキスト(図形、写真など)領域を持つ画像の特徴量にもとづいて代表画像を選定する処理に係る。
図6は、この実施例の処理系の1例を示すブロック図である。なお、この処理系は、図5のステップS101、S102を実行するための1手段に相当する。
図6の処理系への入力は、文書ファイル中の画像である。画像は、1枚ずつ入力され、この処理系を通して代表画像として選定するか否かの処理結果が出力される。
画像領域判定部51は、入力された画像のビットマップからOCR等を用いて、テキストと非テキスト(図形、写真など)それぞれを認識し、各々の領域を抽出する。
テキスト領域面積計算部52は、画像領域判定部51によって抽出されたテキスト領域の画像面に占める面積を算出する。
非テキスト領域面積計算部53は、画像領域判定部51によって抽出された図形、写真などの非テキスト領域の画像面に占める面積を算出する。
比率計算部54は、テキスト領域面積計算部52、非テキスト領域面積計算部53それぞれによって計算された面積の比率を画像の特徴量として算出する。
代表画像判定部55は、比率計算部54によって算出された比率に対し、所定の判定基準に照らして代表画像として選出するか否かを判定し、判定結果を出力する。なお、上記所定の判定基準は、テキストが多い文書、逆にイラストなどの図形が多い文書ではそれぞれ代表画像を逆にした方が有効となる場合があり、この場合には、文書の性質に応じて判定基準を適応させることが必要になる。
代表画像を選定する処理のもう1つの実施例は、画像に含まれるテキストの大きさにもとづいて代表画像を選定する処理に係る。
図7は、この実施例の処理例を示すフロー図である。なお、この処理フローは、図5のステップS101、S102の1実施例に相当する。
図7の処理フローの処理対象は、文書ファイル中の各画像である。対象画像は1枚ずつこの処理フローを通すことで、代表画像として選定するか否かの処理結果を得る。
処理を開始すると、先ず、処理対象画像のビットマップからOCR等を用いて、テキストを認識し、各テキスト領域の抽出を行う(ステップS301)。
テキスト領域ごとにテキストの大きさを求め、求めた結果をもとに処理対象画像に含まれるテキストの大きさの最大値を得る処理を行っていくので、まずステップS301で抽出されたテキスト領域の1つについて、1ライン合成処理を行うことによりその領城のテキストの高さを求める(ステップS302)。
次に、ステップS302で求めたテキストの高さが、後述する最大値リストに保持されているこれまでに得たテキスト高さの最大値を超えるか否かを判断する(ステップS303)。ここで、テキスト高さのこれまでの最大値を超えない場合(ステップS303−NO)、何も処理をすることなく、未処理のテキスト領域があるか否かを確認するステップS305の処理に移行する。
他方、ステップS302で求めたテキストの高さが、テキスト高さのこれまでの最大値を超える場合(ステップS303−YES)、超えたテキスト高さ(1ラインテキスト画像)を当該処理対象画像に含まれるテキストの最大値を保持する最大値リストの値を更新する(ステップS304)。
次に、テキスト領域全ての処理を済ませたか否かを確認し(ステップS305)、済ませていなければ(ステップS305−NO)、次のテキスト領域の処理をするためにステップS302に戻る。
他方、テキスト領域全ての処理を済ませたことが確認できれば(ステップS305−YES)、上記の処理で最大値リストに保持されテキストの最大値をもとに、所定の判定基準に照らして代表画像としてこの処理対象画像を選出するか否かを判定し、判定結果を得る(ステップS306)。なお、上記判定基準は、タイトルが記載されたページを代表画像にする基準を設定することで、多数の普通の文字サイズのページを選定することなく、有効な代表画像が選べる。
ステップS306の選定結果を得て、このフローの処理を終える。
次に、上記のようにして選定された代表画像を用いて行う合成処理の実施例を示す。
この実施例は、代表画像を合成し、疑似パラパラ画像、即ち本を速めくりして検索するときに目視できる画像内容を1枚にまとめて表示する画像、を生成する処理(上記「疑似パラパラ画像の生成原理」の合成処理の説明、参照)に係る。
図8は、この実施例の処理例を示すフロー図である。なお、この処理フローは、図5のステップS103の1実施例に相当する。
図8の処理フローでは、文書ファイルを構成する画像から選定された複数枚の代表画像を載せた代表画像リストの代表画像を対象に合成処理を行い、疑似パラパラ画像を生成する。
処理を開始すると、先ず、代表画像リストに載せた代表画像に互いに近接する代表画像があるか否かを確認する(ステップS401)。この条件は、代表画像同士でページがあまり離れると、文書内容の関連性もなくなるので、近接する代表画像に絞って合成の対象にするための条件である(上記「疑似パラパラ画像の生成原理」の合成処理の説明、参照)。
ここで、近接する代表画像がない場合には(ステップS401−NO)、合成処理の対象になる代表画像がないので、このフローの処理を終了する。
他方、ステップS401で近接する代表画像がある場合には(ステップS401−YES)、合成処理を実行するので、処理対象とする互いに近接した関係にある代表画像群を格納した記憶場所から取り出す(ステップS402)。
次に、処理対象とする代表画像群について、これらの画像が代表画像として選定される根拠となった特徴を示す画像部分を画像オブジェクト(図形、文字などのオブジェクト)として選択する(ステップS403)。なお、選択する画像オブジェクトは、代表画像群全体で特徴値(量)の高いものからN個とする。
次に、処理対象とする代表画像群の中でも文書の代表に相応しい1枚のページ画像、例えば、表題が示されたページ画像をベース画像として描画する(ステップS404)。
ベース画像の描画の後、ステップS403で選択したN個の画像オブジェクトをベース画像に合成して描画する処理を行う。この実施形態の処理では、画像オブジェクト同士が重なる場合に後から重ねる画像オブジェクトは描画しないという対応で処理をする。
よって、処理の手順としては、N個の画像オブジェクトを1個ずつ描画対象として選択し(ステップS405)、描画対象として選択した画像オブジェクトが既に描画した画像オブジェクトと重なるか否かを確認する(ステップS406)。
ここで、既に描画した画像オブジェクトと重ならない場合には(ステップS406−NO)、この描画対象の画像オブジェクトの描画処理を行う(ステップS407)。
他方、既に描画した画像オブジェクトと重なる場合には(ステップS406−YES)、後から重ねる画像オブジェクトの描画をしないので、この画像オブジェクトを描画対象から除外する処理を行う(ステップS408)。この処理は、互いに近接した関係にある代表画像群として処理対象リストに載せたこの画像オブジェクトの代表画像をリストから削除する処理により、描画対象のN個の画像オブジェクトからも除くことが可能である。
1個の画像オブジェクトを対象とするステップS406〜408の処理を終えた後、ステップS409では、描画対象のN個全ての画像オブジェクトが処理済みであるか否かを確認し、未処理の画像オブジェクトがあれば(ステップS409−NO)、次の画像オブジェクトの処理に移行するためにステップS405に戻る。
他方、全ての画像オブジェクトが処理済みであれば(ステップS409−YES)、この文書ファイルの全代表画像が処理済みであるか否かを確認し(ステップS410)、未処理の代表画像があれば(ステップS410−NO)、次の代表画像の処理に移行するためにステップS401に戻る。
この文書ファイルの全代表画像が処理済みであれば(ステップS410−YES)、この近接代表画像合成処理のフローを終了する。
上記の処理フローに示したように、この実施例の合成処理により、近接する代表画像に絞った代表画像群全体で特徴値(量)の高い画像オブジェクト、即ち、合成対象に選定した代表画像のうち選定の根拠とした特徴が顕著に表れている画像オブジェクトの順に描画し、画像オブジェクト同士が重なる場合に後から重ねる画像オブジェクトの描画をしないようにした。この描画方法によって、重要な画像の見落としをなくし、目視による的確な検索ができるようになる。
なお、上記の処理フローでは、既に描かれた画像オブジェクトに次の描画対象の画像オブジェクトが重なるときには、描画をしない(上記ステップS408)という条件で合成画像を生成しているが、重なりが生じるときに、描画位置をずらして重ならないように描画することによって、画像オブジェクトの消失をなくす方法により実施してもよい。
また、描画対象の画像オブジェクトに重なりが生じるときに、重なる部分を透かして描画する方法もあり、このときはより特徴値が大きい画像が目立つように、たとえば濃い色になるように表示することにより、重要な画像を見落とさず、目視による的確な検索を可能にする。この方法は、先に図11を参照して述べた線形和による合成方法の欠点を補う方法でもある。
「サムネイルヘの代表画像の補充」
上記実施形態で述べた疑似パラパラ画像は、サムネイルとして、本を速めくりして検索するときに目視される画像に近づける、という意識のもとに、複数枚の画像よりなる文書ファイルから一見して記憶に残る特徴を持つ(特徴値の高い)複数枚の代表画像を選定し、これらをサムネイルとする際にも、特徴値が高いほど目に付きやすくする合成方法によって1枚の画像にまとめている。このため、ページ全体のレイアウト等に着目した特徴の捉え方で文書ファイルを検索しようと試みるユーザーがいる場合、疑似パラパラ画像を用いても有効な検索を行えず、こうしたユーザーの要求に応えることができない。
そこで、ここでは、サムネイルとして用意する疑似パラパラ画像に加えて、疑似パラパラ画像を生成する過程で用いられなかった代表画像を補充した複数画像構成のサムネイルを利用する実施形態について示す。
図9は、本実施形態の疑似パラパラ画像と代表画像の合成画像で構成する1枚のサムネイル画像を例示する図である。
同図(A)は、1枚のサムネイル画像領域を4分割した領域の1つを疑似パラパラ画像とし、その他の3領域には、それぞれ補充する代表画像を配置する例を示し、同図(B)は、1枚のサムネイル画像領域を4分割した4領域には、それぞれ補充する代表画像を配置し、これら4領域に重ねた真ん中の1つの領域に疑似パラパラ画像を配置する例を示し、同図(C)は、4分割した領域の2つを疑似パラパラ画像とし、その他の2領域には、それぞれ補充する代表画像を配置する例を示す。
補充する代表画像で生成するサムネイル画像は、当初の疑似パラパラ画像の生成に用いられなかった代表画像から選定し、選定した1枚の代表画像をもとに生成しても良いし、選定した複数枚の代表画像をもとに合成画像、例えば別の疑似パラパラ画像を生成しても良い。
図10は、本実施形態に係るサムネイル画像の生成処理フローの概略図である。
図10の処理フローに従い、画像処理装置(システム)100(図4)が行う本実施形態に係るサムネイル画像の生成処理を説明する。
なお、図10の処理フローにおけるステップS201〜S203は、疑似パラパラ画像を生成する処理であるから、先に図5のステップS101〜S103について行った説明と変わらない。よって、先の説明を参照することとする。
ステップS201〜S203を実行することにより、疑似パラパラ画像(図3参照)の生成処理を行い、得られる画像は一旦記憶部に保持する。
この後、前段までの処理で得られた疑似パラパラ画像に加えて、該疑似パラパラ画像を生成する過程で用いられなかった代表画像を補充した構成のサムネイルを生成する処理に移行する。
補充する代表画像(以下、「補充画像」という)は、上記図9に例示したように、疑似パラパラ画像とは別にそれぞれが独立した複数枚の画像を用意する。また、複数の補充画像は、疑似パラパラ画像を生成する過程で用いられなかった代表画像の中から、文書ファイルの内容を特徴付ける画像を選定する。
文書ファイルの内容を特徴付ける補充画像としては、例えば、
・表紙の完全な画像、特に疑似パラパラ画像で選定されない場合に表示画像を単独で用いる画像
・疑似パラパラ画像で図形、写真が多く選定されている場合に表題が載ったテキスト主体のページ画像
・上記とは逆に、テキスト主体の場合に疑似パラパラ画像から外れた図形、写真が載った画像
・代表画像同士が近接していることを条件とする疑似パラパラ画像からこの条件を満たさないために外れた顕著な特徴(特徴値の高い)を持つ画像
等の画像を用いることが有効である。
なお、サムネイルを構成する補充画像は数の制限があるので、単独でも良いが、選定した複数の代表画像を1枚に合成する方法を採用しても良い。
図10のフローに戻ると、疑似パラパラ画像と補充画像よりなる複数画像構成のサムネイルを生成する処理として、上記のような方法に従いサムネイル化する補充画像に用いる代表画像を選定する(ステップS204)。
次に、複数画像構成のサムネイルとして疑似パラパラ画像に追加して補充画像を貼り付けて1枚のサムネイル画像を合成する(ステップS205)。ここで行う合成は、例えば、図9で例示したレイアウトで1枚の画像の領域を分割して、疑似パラパラ画像、補充画像それぞれを分割した領域に貼り付ける。
疑似パラパラ画像と補充画像を合成することで目的のサムネイル画像が得られるので、このフローの処理を終了する。
この実施形態で生成する疑似パラパラ合成画像と代表画像の複数の組によるサムネイル画像により、文書ファイルの画像中に点在している特徴的な部分画像と、文書画像中のページ中のレイアウト(構成)などの情報を同時に目視することが可能になる。これらの情報の目視結果を総合判断することで、文書ファイルの識別能力を高めることが可能になり、目指す文書の目視による検索が容易かつ的確に行えるようになる。更に、疑似パラパラ画像と補充画像よりなるサムネイル画像それ自体がコンピュータの理解できる情報であるから、生成したサムネイル画像並びにその画像要素をコンピュータによって検索することにより文書ファイル検索の処理を速くすることが可能になる。
2・・CPU、3・・メモリ、5・・表示装置、6・・HDドライブ、7・・入力装置、15・・IF(インターフェース)、16・・外部デバイス、51・・画像領域判定部、52・・テキスト領域面積計算部、53・・非テキスト領域面積計算部、54・・比率計算部、55・・代表画像判定部、100・・画像処理装置。
特開2005−327249号公報 特開2009−110360号公報

Claims (12)

  1. 複数枚の画像よりなる文書ファイルの該画像から代表画像を選定する画像選定部及び前記画像選定部によって選定された代表画像をもとに前記文書ファイルのサムネイル画像を生成するサムネイル生成部を有する画像処理装置であって、
    前記画像選定部は、画像属性に係る特徴によって代表画像を選定する手段であり、
    前記サムネイル生成部は、前記画像選定部によって選定された代表画像がファイルフォーマット上近接した関係にあることを条件に該代表画像同士を重ね合わせて1枚のサムネイル画像を生成する画像合成手段を備える
    ことを特徴とする画像処理装置。
  2. 請求項1に記載された画像処理装置において、
    前記画像合成手段は、合成の対象とする代表画像の前記特徴を示す画像部分の強調処理を行うことを特徴とする画像処理装置。
  3. 請求項1又は2に記載された画像処理装置において、
    代表画像の選定基準とする前記特徴が、選定対象画像を構成する要素の大きさであることを特徴とする画像処理装置。
  4. 請求項1又は2に記載された画像処理装置において、
    代表画像の選定基準とする前記特徴が、選定対象画像を構成する文字要素の大きさあるいは強調度であることを特徴とする画像処理装置。
  5. 請求項1乃至4のいずれかに記載された画像処理装置において、
    代表画像の選定基準とする前記特徴が、選定対象画像を構成する要素のカラー化であることを特徴とする画像処理装置。
  6. 請求項1乃至5のいずれかに記載された画像処理装置において、
    代表画像の選定基準とする前記特徴が、ファイルフォーマット上前後する選定対象画像の特徴量の変化であることを特徴とする画像処理装置。
  7. 請求項6に記載された画像処理装置において、
    前記特徴量の変化が、テキスト領域と非テキスト領域の比率の変化であることを特徴とする画像処理装置。
  8. 請求項1乃至7のいずれかに記載された画像処理装置において、
    前記画像選定部は、選定した代表画像のうち前記特徴が顕著に表れている画像だけをサムネイルの生成に用いる代表画像として選別する手段を備える
    ことを特徴とする画像処理装置。
  9. 請求項1乃至7のいずれかに記載された画像処理装置において、
    前記画像選定部は、選定した代表画像のうち前記特徴が顕著に表れている画像及びその他の画像それぞれを1枚のサムネイルの生成に用いる代表画像として選別する手段を備える
    ことを特徴とする画像処理装置。
  10. コンピュータを請求項1乃至9のいずれかに記載された画像処理装置が有する前記画像選定部、前記サムネイル生成部として機能させるためのプログラム。
  11. 請求項10に記載されたプログラムを記録したコンピュータ読み取り可能な記媒体。
  12. 複数枚の画像よりなる文書ファイルの該画像から代表画像を選定する画像選定工程及び前記画像選定工程で選定された代表画像をもとに前記文書ファイルのサムネイル画像を生成するサムネイル生成工程を有する画像処理方法であって、
    前記画像選定工程は、画像属性に係る特徴によって代表画像を選定する工程であり、
    前記サムネイル生成工程は、前記画像選定工程で選定された代表画像がファイルフォーマット上近接した関係にあることを条件に該代表画像同士を重ね合わせて1枚のサムネイル画像を生成する画像合成工程を有する
    ことを特徴とする画像処理方法。
JP2010012330A 2010-01-22 2010-01-22 画像処理装置、画像処理方法、プログラム及び記録媒体 Expired - Fee Related JP5423422B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010012330A JP5423422B2 (ja) 2010-01-22 2010-01-22 画像処理装置、画像処理方法、プログラム及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010012330A JP5423422B2 (ja) 2010-01-22 2010-01-22 画像処理装置、画像処理方法、プログラム及び記録媒体

Publications (2)

Publication Number Publication Date
JP2011151674A JP2011151674A (ja) 2011-08-04
JP5423422B2 true JP5423422B2 (ja) 2014-02-19

Family

ID=44538262

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010012330A Expired - Fee Related JP5423422B2 (ja) 2010-01-22 2010-01-22 画像処理装置、画像処理方法、プログラム及び記録媒体

Country Status (1)

Country Link
JP (1) JP5423422B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7404766B2 (ja) * 2019-10-21 2023-12-26 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
JP2023146246A (ja) 2022-03-29 2023-10-12 富士フイルムビジネスイノベーション株式会社 情報処理システム、情報処理装置、およびプログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006231676A (ja) * 2005-02-24 2006-09-07 Canon Inc 画像処理装置
JP2009251587A (ja) * 2008-04-11 2009-10-29 Ricoh Co Ltd 画像表示装置、画像表示方法及び画像表示プログラム

Also Published As

Publication number Publication date
JP2011151674A (ja) 2011-08-04

Similar Documents

Publication Publication Date Title
JP4333348B2 (ja) ディジタル画像を編成してユーザへ表示する方法をプロセッサに実行させるプログラム
KR101164353B1 (ko) 미디어 콘텐츠 열람 및 관련 기능 실행 방법과 장치
JP5452825B2 (ja) レンダリングのために多頁ドキュメントの頁別にサイズ縮小するための方法
JP2008234658A (ja) テキスト検索エンジンにより検索されたページ番号付き文書全体を通してのコースツーファイン・ナビゲーション
JP5361174B2 (ja) 表示制御装置、表示制御方法、およびプログラム
US7555729B2 (en) Signal bearing medium bearing image display program and image display apparatus
JP2008234148A (ja) 文書表示装置、文書表示方法及び文書表示プログラム
JP2008236468A (ja) 画像ファイル管理装置及びプログラム
JP2001337994A (ja) サムネイル表示システムと方法およびその処理プログラムを記録した記録媒体
JP2008052496A (ja) 画像表示装置、画像表示方法、プログラムおよび記録媒体
JP5423422B2 (ja) 画像処理装置、画像処理方法、プログラム及び記録媒体
JP5271015B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP5539070B2 (ja) 情報処理装置、情報処理方法、およびプログラム
US20070002339A1 (en) Image processing apparatus and image processing method
JP6353261B2 (ja) 情報処理装置、制御方法およびプログラム
JP6701268B2 (ja) 情報処理装置、制御方法およびプログラム
JP5365537B2 (ja) 情報処理装置及び情報処理プログラム
JP4501731B2 (ja) 画像処理装置
JP5407700B2 (ja) 画像処理システム、情報処理装置、画像処理装置、及びプログラム
JP6457249B2 (ja) 電子ドキュメント管理装置、電子ドキュメント管理システムおよび電子ドキュメント管理用プログラム
JP5712612B2 (ja) 電子文書変換装置及び電子文書変換方法
JP5867253B2 (ja) 画像形成装置およびプログラム
JP2011186835A (ja) 画像処理装置及び画像処理プログラム
JP2009140311A (ja) 文書処理装置および文書処理方法
JP2006085214A (ja) 写真処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121017

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130516

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130607

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130802

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131029

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131111

R151 Written notification of patent or utility model registration

Ref document number: 5423422

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees