JP2007133878A - 多数の画像のブラウズ方法、装置、システム、及びプログラム - Google Patents

多数の画像のブラウズ方法、装置、システム、及びプログラム Download PDF

Info

Publication number
JP2007133878A
JP2007133878A JP2006302552A JP2006302552A JP2007133878A JP 2007133878 A JP2007133878 A JP 2007133878A JP 2006302552 A JP2006302552 A JP 2006302552A JP 2006302552 A JP2006302552 A JP 2006302552A JP 2007133878 A JP2007133878 A JP 2007133878A
Authority
JP
Japan
Prior art keywords
image
images
composite
composite image
generating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006302552A
Other languages
English (en)
Inventor
T Foote Jonathan
ティー. フート ジョナサン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Publication of JP2007133878A publication Critical patent/JP2007133878A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00408Display of information to the user, e.g. menus
    • H04N1/0044Display of information to the user, e.g. menus for image preview or review, e.g. to help the user position a sheet
    • H04N1/00442Simultaneous viewing of a plurality of images, e.g. using a mosaic display arrangement of thumbnails
    • H04N1/00445Simultaneous viewing of a plurality of images, e.g. using a mosaic display arrangement of thumbnails arranged in a one dimensional array
    • H04N1/00448Simultaneous viewing of a plurality of images, e.g. using a mosaic display arrangement of thumbnails arranged in a one dimensional array horizontally
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00408Display of information to the user, e.g. menus
    • H04N1/0044Display of information to the user, e.g. menus for image preview or review, e.g. to help the user position a sheet
    • H04N1/00458Sequential viewing of a plurality of images, e.g. browsing or scrolling

Abstract

【課題】画像表示装置において、多数の画像を閲覧性よく合成して表示し、閲覧できるようにする方法、装置、システム、及びこのような画像表示装置を動作させるプログラムを提供する。
【解決手段】本発明の方法では、表示されることができる各画像の解像度を一様に縮小するのではなく、各画像の実際に示される部分を異なる割合で縮小して合成する。この方法では、各画像のどの部分をどのような割合で示すかを決定するパラメータを選択する。時間とともにこのパラメータを変化させることで、表示される情報をさらに増やすことができる。
【選択図】図1

Description

本発明は、多数の画像を画像表示装置でブラウズ(閲覧)するための方法、装置、システム、及びプログラムに関する。
画像キャプチャ(捕捉)装置を想定すると、記憶されているキャプチャ画像をこのデバイスで見るのが非常に望ましい。キャプチャ装置の主な機能は、そこ記憶されている画像を見ることである場合もある。
こういったデバイスがますます普及し、その記憶容量が増えるにつれて、見たり選択したりする画像の数も増える。対照的に、ハードディスクドライブや他の記憶装置がより小型になるにつれて、ディスプレイのサイズがデバイスの全体的なサイズに対して制限されてくる。こういったデバイスの物理的なサイズのために、ディスプレイは必然的にサイズ(デバイスに収まらなければならない)と解像度(人間の目は、一定の距離で有限数のピクセルしか分解できない)の両方において制限される。こういった小型ディスプレイ上での画像の選択、ブラウズ、そしてアクセスは、既存のユーザインタフェースでは十分にサポートされていない。大きな画像コレクションのブラウズや管理のための現在のアプローチでは、ほぼ一般的に「ライトテーブル」のメタファを使用し、そこで画像は縮小解像度の「サムネイル」画像として表され、通常大型のスクロール可能な2次元領域に表示される。所望のサムネイルが見えるまでスクロールし、そして所望のサムネイルをマウスなどのポインティングデバイスを使用して選択することで、画像にマークを付ける(マーキングする)ことができる。
現在のアプローチは、多数の理由から小型ディスプレイには適さない。第1の欠点は、小型ディスプレイのサイズや解像度が縮小されているため、サムネイル画像をさらに縮小できないことである。考えてみると、多くのサムネイルを見ることができるような十分に小さなサイズのサムネイルでは、小さすぎて個々の写真を見ることができない。より大きなサイズのサムネイル画像では、非常に少ないサムネイルしか一度に見られない。さらに、スクロールや選択の動作は一般的に、小型デバイスでは通常見られないマウスまたはポインタを必要とする。
双曲線の非線形関数は、ツリーや階層をブラウズするためにPARC(Xeroxパロ・アルト中央研究所)で開発されたHyperbolic ブラウザにおいてうまく使用されてきた(非特許文献1)。サムネイルを使用した画像のブラウズは、当業界では非常によく知られている。この変形例には、遠近歪み(非特許文献2)または他の歪み(非特許文献3)または可変のサムネイルサイズ(非特許文献4および非特許文献5)を使用した画像またはサムネイルのワープが含まれる。
Lamping, J., R. Rao, and P. Pirolli, "A Focus+Context Technique Based on Hyperbolic Geometry for Visualizing Large Hierarchies" Proc. CHI 95, ACM Conference on Human Factors in Computing Systems 1995, ACM: New York(ランプリングら著「大規模階層構造を可視化するための双曲線幾何学によるFocus+Context技術」、ACM コンピュータシステムにおける人的ファクターに関する協議会会報、1995年) Juha Lehikoinen and Antti Aaltonen "Saving Space by Perspective Distortion When Browsing Images on a Small Screen", OZCHI 2003, 26-28 November 2003, Brisbane Australia(レヒコイネンら著「小スクリーンで画像をブラウジングする際の遠近変形による省スペース」、OZCHI 2003年11月号、pp26-28) Y. K. LY. K. Leung and M.D. Apperley "A Review and Taxonomy of Distortion-Oriented Presentation Techniques", ACM Transactions on Computer-Human Interaction (TOCHI), vol. 1 issue 2 (June 1994), pp 126-140(リョンら著「変形指向表示技術の検討及び分類」、ACM コンピュータ−人間間の対話に関するトランザクション 第1巻、1994年6月、pp126-140) Johnson, B., Shneiderman, B. "Treemaps; a space-filling approach to the visualization of hierarchical information structures", Proc. of the 2nd International IEEE Visualization Conference pp. 284-291 San Diego, Oct. 1991(ジョンソンら著「ツリーマップ:階層情報構造を可視化する空間充填手法」、第2回IEEE 可視化技術国際協議会会報、1991年10月、pp284-291) Shingo Uchihashi, Jonathan Foote, Andreas Girgensohn, and John Boreczky. "Video Manga: Generating Semantically Meaningful Video Summaries", Proceedings ACM Multimedia (Orlando, FL) ACM Press, pp. 383-392, 1999(ウチハラら著、「ビデオマンガ:意味論的に重要なビデオサマリーの生成」、ACM マルチメディア会報、1999年、pp383-392)
本発明は、画像表示装置において、多数の画像を閲覧性よく合成して表示し、閲覧できるようにする方法、装置、システム、及びこのような画像表示装置を動作させるプログラムを提供することを目的とする。
本発明は、多数のデジタル画像にアクセスするための新規のユーザインタフェースを提供する。本発明の一実施形態は、デジタルカメラ、カメラ付き携帯電話、PDA、ビデオカメラなどの携帯用画像形成装置に組み込まれた小型ディスプレイに適用可能である。
本発明では、多数の画像を可能な限り最大の解像度で示すためのアルゴリズム(方法)が定義されている。この方法では、各画像の解像度を縮小する代わりに、実際に示される部分を縮小する。各画像のどの部分を示すかを選択することが、本発明の顕著な特徴である。
本発明の請求項1に係る発明は、複数の画像から合成画像を生成する方法であって、(a)「ズーム」および「スクラブ」パラメータを選択し、(b)前記パラメータに基づいて前記複数の画像から表示画像のセットを生成し、(c)前記表示画像のセットに基づいて前記合成画像を生成すること、を含むことを特徴とする。
請求項2に係る発明は、請求項1の方法において、(d)前記合成画像の1以上の画像境界を選択し、(e)前記複数の画像境界に基づいて前記合成画像を生成すること、をさらに含むことを特徴とする。
請求項3に係る発明は、請求項1の方法において、前記1以上の画像境界が非線形画像境界であることを特徴とする。
請求項4に係る発明は、請求項3の方法において、前記1以上の画像境界が逆双曲線正接関数によって画定されることを特徴とする。
請求項5に係る発明は、請求項3の方法において、前記1以上の画像境界がパラメトリック星型関数によって画定されることを特徴とする。
請求項6に係る発明は、請求項3の方法において、前記画像境界を選択するために、x=cosγ(t)およびy=sinγ(t)によって定義される関数を使用し、式中0<t<π/2および2<γ<∞であることを特徴とする。
請求項7に係る発明は、請求項1の方法において、前記「ズーム」及び前記「スクラブ」パラメータの一方または両方が時間とともに流動的に変化することを特徴とする。
請求項8に係る発明は、請求項1の方法において、前記「ズーム」及び前記「スクラブ」パラメータの一方または両方が時間とともに迅速に変化することを特徴とする。
請求項9に係る発明は、請求項1の方法において、前記表示画像のセットを順序付け、順序付けられた表示画像のセットからなる合成画像を生成することをさらに含むことを特徴とする。
請求項10に係る発明は、請求項9の方法において、前記順序付けられた表示画像のセットが、画像ファイルタイムスタンプ、ファイル名、または検索クエリーに類似するものからなる群から選択されたパラメータに基づいて順序付けられることを特徴とする。
請求項11に係る発明は、請求項9の方法において、前記合成画像における他の可視画像は、前記中心画像に順に隣接しており、一方前記中心画像から順に離れていく画像は隠されるかまたは前記合成画像には示されないことを特徴とする。
請求項12に係る発明は、請求項1の方法において、前記合成画像を表示することをさらに含むことを特徴とする。
請求項13に係る発明は、請求項12の方法において、前記「ズーム」及び前記「スクラブ」の一方または両方を動的に変化させることで、表示される前記合成画像を時間と共に変化させるステップをさらに含むことを特徴とする。
請求項14に係る発明は、請求項13の方法において、前記「ズーム」及び前記「スクラブ」の一方または両方は、1以上のさらなる作業のために1以上の画像を選択するのに使用され、前記作業はマーキング、プリント、コピー、削除からなる群から選択されることを特徴とする。
請求項15に係る発明は、請求項1の方法において、前記画像がビデオストリームから選択されることを特徴とする。
請求項16に係る発明は、複数の順序付けられた画像から、中心画像の注目領域と1以上の近傍画像からなる合成画像を生成する方法であって、(a)「ズーム」および「スクラブ」パラメータの一方または両方を選択し、(b)前記パラメータに基づいて前記複数の画像から表示画像のセットを選択し、(c)1以上の画像境界に基づいて合成境界を選択し、(d)前記表示画像のセットと前記合成境界に基づいて前記合成画像を生成すること、を含むことを特徴とする。
請求項17に係る方法は、請求項16の方法において、前記合成画像を表示することをさらに含むことを特徴とする。
請求項18に係る発明は、複数の画像からの合成画像を表示するための装置であって、(a)「ズーム」および「スクラブ」パラメータを生成する手段と、(b)前記パラメータに基づいて前記複数の画像から表示画像のセットを選択する手段と、(c)1以上の画像境界を選択する手段と、(d)前記複数の画像境界に基づいて合成境界を生成する手段と、(e)前記表示画像のセットと前記合成境界に基づいて前記合成画像を生成する手段と、(f)前記合成画像を表示する手段と、を含むことを特徴とする。
請求項19に係る発明は、複数の画像からなる合成画像を表示するシステムであって、前記システムが、(a)1以上のパラメータセットを特定可能であり、前記1以上のパラメータセットをソースコードに転送可能であり、前記ソースコードを一連のタスクにコンパイルして前記複数の画像からなる合成画像を表示可能である1以上のプロセッサと、(b)1以上のプロセッサによる処理時に、1以上のパラメータセットを特定し、前記1以上のパラメータセットをソースコードに転送し、前記ソースコードを一連のタスクにコンパイルして前記複数の画像からなる前記合成画像を表示することを、システムに実行させる記憶された命令を含む機械可読媒体と、を含むことを特徴とする。
請求項20に係る発明は、複数の画像を代表する合成画像を表示するための処理をコンピュータに実行させるプログラムであって、前記プログラムはコンピュータに、(a)「ズーム」および「スクラブ」パラメータを選択し、(b)前記パラメータに基づく前記複数の画像から表示画像のセットを生成し、(c)1以上の画像境界を選択し、(d)前記複数の画像境界に基づく合成境界を決定し、(e)前記表示画像のセットと前記合成境界に基づく合成画像を生成し、(f)前記合成画像を表示すること、を含む処理を実行させることを特徴とする。
本発明により、比較的サイズの小さな表示領域を有する画像表示装置において、多数の画像をより高解像度で閲覧性よく合成して表示することができる。
本発明の好適な実施形態を、以下の図面に基づいて詳細に説明する。
図1は、本発明を適用したPDAやその他の画像ブラウズ装置におけるイベントフローチャートのブロック図を示し、このブラウズ装置ではロジックルーチンが各コントローライベント後に「合成」画像を計算し、本発明にしたがって可視画像をリターンする。合成画像は、画像から選択されたピクセルからなる。
図2(a)は、写真プリントの束のように相互に重ねられた画像を示し、以降これを「スタックアナロジー」又は「スタック」と称する。一番上の画像のある領域を削除することで、その下の画像の一部が見えてくる。図2(b)のように、こうして露出された画像のある領域を切り取ることで、その下の画像が見えてくる。このようにして、多数の画像の一部を最大解像度で単一の小型ディスプレイ上に表示することができる。利用可能な解像度およびアスペクト比で最もよく表示できるように、異なるサイズまたはアスペクト比の画像をリサイズ(サイズ変更)、パディング(サイズに合わせて足りない領域を補充)、およびトリミング(切り抜き)の少なくともいずれかを行う。図2には3枚の画像しか示されていないが、こういった方法を任意の枚数の画像に対して一般的に行うことができることに注目されたい。画像は、タイムスタンプ、ファイル名または検索クエリーに類似するものなどの何らかの自然な順番で重ねられることが想定される。デジタルビデオストリームから画像を選択することもできる。したがってこのブラウズ方法を、特定の関連シーンを検索する際にビデオを迅速にブラウズする手段として使用してもよい。
大部分の画像が重ね順でより高い位置にある画像に隠されてしまうため、このようにして作成された静止画像は満足のいかないものかもしれない。本発明の一実施形態では、各画像で見えてくる領域を流動的かつ迅速な形でダイナミック(動的)に変える方法を提案する。したがって、画像の一部しか一度に露出されなくても、短時間で多くの画像を完全に見ることができる。
本発明の一実施形態では、「合成」画像は、部分的に削除された領域を有する画像を1つまたはそれより多く重ねることで形成される。図3は、本発明の一実施形態にしたがって図2(b)の3枚の画像から形成された「合成」画像の一例を示す。本発明の一実施形態では、「合成」画像において、可視画像の1つを「中心」画像とみなす。本発明の一実施形態では、この「中心」画像は常にではないが一般的に、「合成」画像における中央の画像である。例えば図2の中央画像が、図3の合成画像における「中心」画像である。本発明の一実施形態では、他の可視画像はスタック(積層)順で隣接しており、中心画像から離れている画像は隠れている。
本発明の一実施形態では、種々の画像が見えるように、そして「合成」画像に含まれる各画像の領域を変えるために、パラメータを時間とともに変化させることができる。本発明の一実施形態では、「スクラブ」がこのような(時間を正確に前後に移動させるビデオ編集技術と同様の)パラメータである。本発明の一実施形態では、「スクラビング」(「スクラブ」処理)は中心画像と近傍画像、即ち「表示画像のセット」を選択する。「スクラブ」パラメータを連続的に変化させることで、スタックから新しい画像が含まれる一方、「合成」画像においてそれまで見えていた画像が隠れる。スクラビングによって、スタックにおける可視画像が上下に移動する(図4を参照)。スクラビングの効果は、「スタックアナロジー」に示される(図7を参照)。図4は、大きな「スクラブ」調整の効果を示す。図4では、大きな「スクラブ」調整によって、「合成」画像に異なる中心画像が含まれる(例えば、図4(a)と図4(b)の比較または図4(c)と図4(d)の比較)。対照的に、小さな「スクラブ」調整の効果で、同じ画像の異なる領域が含まれたり(例えば、図4(b)と図4(c)の比較)、「合成」画像における隣接画像の異なる領域が含まれたりする。本発明の一実施形態では、迅速な画像のスクラビングによって、時間とともに各画像の全ての部分を可能な限り最高の解像度で示すことができる。
「ズーム」は、表示された「表示画像のセット」を制御するために使用可能な別のパラメータである。図5は、中心画像の露出の変化を示す。本発明の一実施形態では、「ズーム」は(従来使用されている用語の意味のように)画像の縮尺を変えない。むしろ「ズーム」は、中心画像が露出する(そして近傍画像が隠される)程度を変える。本発明の一実施形態では、「ズーム」を最大にした場合には中心画像だけが「合成」画像に表示される。「ズーム」の縮小によって徐々により多くの近傍画像が合成画像に含まれてくる。図5(a)と図5(d)の比較を参照のこと。最小「ズーム」の限界では、最大数の画像が「合成」画像に含まれる。本発明の一実施形態では、最小「ズーム」は所定の数の画像に制限される。この数は、何枚の画像を利用可能なディスプレイに同時に表示できるか、及び、何枚が一般的なユーザが見るのに実用的であるかに依存する。実際には、この数は利用可能な画像の総数よりも少ないであろう。
<ユーザインタラクション(対話)>
本発明の一実施形態では、ユーザは自然な範囲にわたって「ズーム」および「スクラブ」パラメータをスムースかつ迅速に調整することができる。本発明の一実施形態では、この範囲によって全ての画像が時間とともに「合成」画像に含まれてこれを見ることができる。各パラメータの制御は、スライダー、ダイアル、サムホイールまたはジョイスティックの軸、マウス、スタイラス、または類似のポインティングデバイスなどの入力を平滑に変化させることが可能な入力装置によって行われるのが理想的である。本発明の一実施形態では、小型のフォームファクタデバイス(規格によって形状が規定されたデバイス)に特に適したインタフェースは傾斜センサである、左または右に傾斜することで、画像のコレクションをより深くまたはより浅く「スクラブ」することができると同時に、前後に傾斜することで「ズーム」を増大または減少させることができる。本発明の一実施形態では、特定の画像へのフル「ズーム」は、マーキング、プリント、コピー、または削除などのさらなる作業のためにその画像を「選択する」のに使用される。
<画像ビュー(閲覧)領域>
可視領域の範囲は、「スクラブ」および「ズーム」パラメータ値が与えられることにより、「合成」画像に対して決定される。本発明の種々の実施形態では、多数の可能なマッピングがある。1つを詳細に検討することで、それを理解して拡張することができる。このマッピングを、「スタックアナロジー」を使用して説明する。説明を簡単にするために、可視領域をディスプレイと同じ高さの矩形とみなす(しかしながら上述のように、本発明の一実施形態では、全ての画像は最適なアスペクト比となるようにパディングまたはトリミングによってリサイズ可能である)。側面から見ると、画像は、図6に示すように平行線の配列のように見える。本発明の一実施形態では、スタックにわたる斜線(図6(a)を参照のこと)が一定の間隔で画像と交差する(画像はスタックにおいて等間隔で離間しているものとする)。図6(b)に示すように、これらの位置を可視領域の境界として使用することができる。本実施の形態では、合成画像はスタック画像の矩形部分から構成される。合成画像の各縦列は、スタックの単一の画像からなる。したがって各ポイントでどの画像が見えるかを決定する関数は、一次元である。この構造によって、切片直線の角度と高さを変化させることで「ズーム」および「スクラブ」効果を制御できる。例えば、この直線をより水平になるように回転することは、「ズーム」の増大に等しい。それは、この直線が図7に示すようにより少ない画像を切り取るため各々の画像がより大きく見えるようになるからである。図7(a)では、交差直線によって6つの層が見えるため、6つの画像が示される。切片直線が垂直から傾斜すると、交差直線によって3層しか見えなくなるため、3つの画像が示される(図7(b)を参照のこと)。既述のように、最小「ズーム」を制限することが一般的に望ましい。これは、切片直線がどの程度垂直に近く角度をなすかを制限することで簡単に行える。
切片直線を上下に移動することで「スクラブ」が変化し、図8に示すように連続する画像が見えたり隠れたりする。図8(a)では、一番上の画像A、BおよびCが見えている。切片直線が下方に移動すると、より奥の画像が徐々に見えてきて、画像E、FおよびGが見えてくる(図8(b)を参照のこと)。
本発明の一実施形態では、「ズーム」および「スクラブ」は直交または独立している。即ち、「スクラブ」(高さ)に影響を及ぼさずに「ズーム」(角度)を変化させることができ、その逆も可能である。実際には、これが一般的に望ましい特性である。
<非線形境界>
本発明の一実施形態では、画像境界は図7および8に表示した同じサイズの矩形よりも注意すべきものである。この画像境界が「合成境界」を作成する。即ち、各々が「表示画像のセット」の1つに適用可能な複数の画像境界が「合成画像」の「合成境界」を作成する。画像境界は「自然発生的」なもので、得られる合成画像は平滑で見た目に美しいのが理想である。同様に、合成画像が時間とともに変化すると、合成境界の変化によって合成画像が作成され、この画像は平滑で、見た目やユーザにとって制御しているときの感触がよい。本発明の一実施形態では、これは幅や形を非線形に制御する非線形境界を使用して行われる。非線形境界は、自然の流動的な動きの感覚を伝達するために使用される。
本発明の一実施形態では、直線の境界が与えられたとしても、図7および8の同じサイズの矩形よりも非線形関数のほうがうまく作用しうる。本発明の一実施形態では、種々の幅の水平(または垂直)境界を決定するために、直線ではなく逆双曲線正接関数を使用することができる。本発明の一実施形態では、関数にオフセットを付加することで、切片直線がシフトを行うように「スクラブ」パラメータを制御する。「ズーム」は、入力引数を関数に対してスケーリング(大小させる)することで制御でき、その結果中心領域はより平坦になり、そのために中心領域の境界がより遠くに離れる。ある特定の実施形態では、後述の(式1)で与えられる関数を使用して、ズームとスクラブの現在の値が与えられると、合成画像の各列に対してx(0≠x<幅)と、合成画像で使用するための画像スタックの奥行きdepthを決定する。図9は、15枚の画像の仮想のスタックにおいて、この関数に対して「スクラブ」(オフセット)および「ズーム」(スケーリング)を変化させた効果を示す。図9(a)は、スクラブ値5、ズーム値0.8の場合の関数を示す。図9(b)は、スクラブ値7.5、ズーム値1.5の場合の関数を示し、図9(c)はスクラブ値8、ズーム値2.5の場合の関数を示す。実線でプロットした画像選択関数は、可視の画像境界を示すために先の式で説明したように整数値に量子化されている。非量子化逆双曲線正接関数は点線で示される。この双曲線関数の主な利点は、(同じ面積を有する線形境界とは異なって)中心画像が常に最も広い可視領域を有することである。したがって中心画像は強調され、所望の画像への「スクラビング」がより簡単になる。境界が各縁に向かって圧縮され、「スクラビング」の際に視覚的に美しい形でスタックされた画像が「剥離」されるという見た目上の利点も有する。
depth=round(zoom*atanh((2x−width)/width+scrub) ・・・(式1)
本発明の一実施形態では、画像境界は時間および空間において非線形に変化することができる。可能なマッピングの十分な調査は、当業者なら理解できる。機能的価値および/または美的価値を有する本発明のさらなる実施形態を提示する。本発明の一実施形態では、非線形画像境界関数を図10に示すように使用する。これは、パラメトリック星型(parametric asteroidal)関数x=cosγ(t)およびy=sinγ(t)から計算される(式中、パラメータtは第1象限で変化し(0<t<π/2)、指数γは境界の曲線を制御する(2<γ<∞))。本発明の一実施形態では、γ=2によって直線の斜線になり、γが増えると曲率は軸線境界に漸近して増える。図10では、パラメータγの値は図10(a)から図10(c)へと増えている。即ち、値は図10(a)におけるよりも図10(b)におけるほうが大きく、図10(b)におけるよりも図10(c)におけるほうが大きい。
この表示には、全ての画像が角に「集中」し、各画像が見えなくても境界の濃度によってコレクションに何枚の画像があるかを予測できる、という利点がある。さらに、画像を簡単に90度回転させることができる。このことは、特定の領域における画像特徴の検索の助けとなる(例えば、もしもユーザが左上の角で顔を検索する場合、境界表示を回転させて、左上が常に中心画像にあって見えるようにすることができる)。
本発明の好適な実施形態の上の記述は、例示と説明の目的で提供されてきた。網羅的であること、または本発明を開示した形態そのままに限定することを意図してはいない。本発明の原理やその実際的な用途をもっともうまく説明するために多くの実施形態を選んで説明したので、当業者なら本発明の種々の実施形態や予想できる特定の使用に適した種々の改変を理解することができる。本発明の範囲は特許請求の範囲とその等価物によって定められることを意図している。
上述してきた本発明の実施形態は、少なくとも1つ以上のプロセッサを備えたコンピュータ又は画像表示装置において実現できる。本発明の実施形態のコンピュータ又は画像表示装置は、(a)「ズーム」および「スクラブ」パラメータを選択する手段と、(b)前記パラメータに基づいて前記複数の画像から表示画像のセットを生成する手段と、(c)前記表示画像のセットに基づいて前記合成画像を生成する手段と、を備え、複数の画像から合成画像を生成する。
該コンピュータ又は装置は、例えば、表示部(ブラウズ装置)を備える携帯情報端末(PDA)、携帯電話等の携帯型デバイスであってもよい。該コンピュータ又は装置は、ユーザからの指示情報や通信網からのデータを入力する入力部、プロセッサ、該プロセッサによる処理実行の際の作業領域を形成すると共にプログラムや処理対象としてのデータを格納する記憶部、処理内容や処理結果を表示する表示部、及び通信網等へデータを出力する出力部等を含みうる。上記各(a)〜(c)の手段はプロセッサであってもよく、また、プロセッサとは別個の手段であってプロセッサにより制御されてもよい。
また、本発明の種々の実施形態は、本開示物の教示にしたがってプログラミングされたプロセッサ(単数または複数)を使用して実施することができ、このことはコンピュータ分野の当業者には明らかであろう。即ち、本発明は、少なくとも1つ以上のプロセッサを備えたPDA等のコンピュータや画像表示装置において、前記プロセッサに本発明の方法を実行させるプログラム、又は該コンピュータや画像表示装置を本発明の上記各(a)〜(c)の手段を有する装置として機能させるプログラムとして実装されることもできる。熟練したプログラマーなら、本開示物の教示に基づいて適当なソフトウェアコーディングを容易に準備することができ、このことはソフトウェア分野の当業者には明らかであろう。集積回路の準備および/またはコンポーネント回路の適当なネットワークの相互接続によって本発明を実施することもでき、このことは当業者には容易に明らかであろう。
種々の実施形態には、本明細書中に提示した特徴のいずれかを実行するために、少なくとも1つ以上の汎用または専用コンピューティングプロセッサ又はデバイスをプログラミングするのに使用可能であり、記憶された命令、プログラム、および/または情報を有する記憶媒体に記憶されることができる、コンピュータプログラムを含む。この記憶媒体は、フロッピー(登録商標)ディスク、光ディスク、DVD、CD−ROM、マイクロドライブ、光磁気ディスク、ホログラフィック記憶デバイス、ROM、RAM、EPROM、EEPROM、DRAM、PRAM、VRAM、フラッシュメモリデバイス、磁気または光カード、ナノシステム(分子メモリICを含む)などのあらゆる種類の物理的媒体、紙または紙ベースの媒体、命令および/または情報の記憶に適したあらゆる種類の媒体またはデバイスのうちの1つまたはそれより多くを含むことができるが、これらに限定されない。種々の実施形態には、1以上のパブリックおよび/またはプライベートネットワークにわたって全体的または部分的に伝送可能なコンピュータプログラムを含み、前記伝送データ中には、1以上のプロセッサが本明細書中に提示した特徴のいずれかを実行するために使用可能な命令、プログラム、情報の少なくともいずれかが含まれうる。種々の実施形態では、この伝送データは複数の別個の伝送データを含むことができる。
本開示は、1以上のコンピュータ可読媒体に記憶された状態で、ハードウェアの少なくとも1つ以上のプロセッサを制御するため、そして本発明の結果を利用してコンピュータまたはプロセッサが人間のユーザまたは他の装置と情報をやりとりできるようにするためのソフトウェア(プログラム)を含む。こういったソフトウェアには、デバイスドライバ、インタフェースドライバ、オペレーティングシステム、実行環境/コンテナ、ユーザインタフェース、アプリケーションが含まれるが、これらに限定されない。
プログラムコードの実行は、直接的でも間接的でもよい。前記コードは、コンパイラ型、インタープリタ型、そして他の種類の言語を含むことができる。記述言語によって別段制限されないならば、機能コードおよび/またはコードセグメントの実行および/または伝送は、その機能を実行するための、他のソフトウェアまたはローカルもしくはリモートデバイスの起動または呼び出しを含むことができる。こういった起動または呼び出しは、ライブラリモジュール、デバイスドライバ、インタフェースドライバ、その機能を実行するためのリモートソフトウェアの起動または呼び出しを含むことができる。前記起動または呼び出しは、分散システムおよびクライアント/サーバシステムにおける起動または呼び出しを含むことができる。
本発明にしたがって多数の画像をブラウズするためのイベントフローチャートのブロック図である。 (a)は概念上の画像の「スタック」であり、(b)は下の画像が見えるように切り取られた画像を示す。 (a)及び(b)は図2の画像から形成された「合成」画像を示す。 (a)〜(d)は「スクラブ」パラメータの効果を示し、「スクラブ」は(a)から(d)へと増大して、「合成」画像において、異なる中心画像(大きな調整)と異なる隣接画像または画像の異なる領域(小さな調整)と隣接画像の異なる領域のいずれかを含む。 (a)〜(d)は「ズーム」パラメータの効果を示し、「ズーム」値は(a)から(d)へと増大して、「合成」画像において徐々に中心画像のより多くを含み近傍画像をより小さくより少なく含む。 (a)及び(b)は画像を「スタック」とみなしたアナロジー(例示)であり、(a)に示すように「スタック」の「スライス」によって、(b)の「合成」画像のオーバーラップ領域が見えてくる。 (a)及び(b)は「ズーム」パラメータの変化を示す図であり、「ズーム」パラメータの変化は、(a)に示すように画像のスタックにおける「スライス」切片直線の角度の変化に等しく、(b)に示すように角度がより水平になると、「合成」画像にはより少ない画像しか表示されない。 (a)及び(b)は「スクラブ」パラメータの変化を示す図であり、「スクラブ」パラメータの変化は、(a)に示すように画像のスタックにおける切片直線の高さの変化に等しく、(b)に示すように切片直線が低くなるとスタックのより下にある画像が「合成」画像に含まれる。 (a)〜(c)は逆正接関数を使用した非線形画像スタック選択を示し、「スクラブ」および「ズーム」パラメータは(a)から(c)へと増大し、量子化関数は実線で示され非量子化関数は点線で示される。 (a)〜(c)は星型の画像境界に対して「ズーム」パラメータを(a)から(c)へと増大した効果を示す。

Claims (20)

  1. 複数の画像から合成画像を生成する方法であって、
    (a)「ズーム」および「スクラブ」パラメータを選択し、
    (b)前記パラメータに基づいて前記複数の画像から表示画像のセットを生成し、
    (c)前記表示画像のセットに基づいて前記合成画像を生成すること、
    を含む方法。
  2. (d)前記合成画像の1以上の画像境界を選択し、
    (e)前記複数の画像境界に基づいて前記合成画像を生成すること、
    をさらに含む請求項1記載の方法。
  3. 前記1以上の画像境界が非線形画像境界である、請求項2記載の方法。
  4. 前記1以上の画像境界が逆双曲線正接関数によって画定される、請求項3記載の方法。
  5. 前記1以上の画像境界がパラメトリック星型関数によって画定される、請求項3記載の方法。
  6. 前記画像境界を選択するために、x=cosγ(t)およびy=sinγ(t)によって定義される関数を使用し、式中0<t<π/2および2<γ<∞である、請求項3記載の方法。
  7. 前記「ズーム」及び前記「スクラブ」パラメータの一方または両方が時間とともに流動的に変化する、請求項1記載の方法。
  8. 前記「ズーム」及び前記「スクラブ」パラメータの一方または両方が時間とともに迅速に変化する、請求項1記載の方法。
  9. 前記表示画像のセットを順序付け、順序付けられた表示画像のセットからなる合成画像を生成することをさらに含む、請求項1記載の方法。
  10. 前記順序付けられた表示画像のセットが、画像ファイルタイムスタンプ、ファイル名、または検索クエリーに類似するものからなる群から選択されたパラメータに基づいて順序付けられる、請求項9記載の方法。
  11. 前記合成画像における他の可視画像は、前記中心画像に順に隣接しており、一方前記中心画像から順に離れていく画像は隠されるかまたは前記合成画像には示されない、請求項9記載の方法。
  12. 前記合成画像を表示することをさらに含む、請求項1記載の方法。
  13. 前記「ズーム」及び前記「スクラブ」の一方または両方を動的に変化させることで、表示される前記合成画像を時間と共に変化させるステップをさらに含む、請求項12記載の方法。
  14. 前記「ズーム」及び前記「スクラブ」の一方または両方は、1以上のさらなる作業のために1以上の画像を選択するのに使用され、前記作業はマーキング、プリント、コピー、削除からなる群から選択される、請求項13記載の方法。
  15. 前記画像がビデオストリームから選択される、請求項1記載の方法。
  16. 複数の順序付けられた画像から、中心画像の注目領域と1以上の近傍画像からなる合成画像を生成する方法であって、
    (a)「ズーム」および「スクラブ」パラメータの一方または両方を選択し、
    (b)前記パラメータに基づいて前記複数の画像から表示画像のセットを選択し、
    (c)1以上の画像境界に基づいて合成境界を選択し、
    (d)前記表示画像のセットと前記合成境界に基づいて前記合成画像を生成すること、
    を含む方法。
  17. 前記合成画像を表示することをさらに含む、請求項16記載の方法。
  18. 複数の画像からの合成画像を表示するための装置であって、
    (a)「ズーム」および「スクラブ」パラメータを生成する手段と、
    (b)前記パラメータに基づいて前記複数の画像から表示画像のセットを選択する手段と、
    (c)1以上の画像境界を選択する手段と、
    (d)前記複数の画像境界に基づいて合成境界を生成する手段と、
    (e)前記表示画像のセットと前記合成境界に基づいて前記合成画像を生成する手段と、
    (f)前記合成画像を表示する手段と、を含む装置。
  19. 複数の画像からなる合成画像を表示するシステムであって、前記システムが、
    (a)1以上のパラメータセットを特定可能であり、前記1以上のパラメータセットをソースコードに転送可能であり、前記ソースコードを一連のタスクにコンパイルして前記複数の画像からなる合成画像を表示可能である1以上のプロセッサと、
    (b)1以上のプロセッサによる処理時に、1以上のパラメータセットを特定し、前記1以上のパラメータセットをソースコードに転送し、前記ソースコードを一連のタスクにコンパイルして前記複数の画像からなる前記合成画像を表示することを、システムに実行させる記憶された命令を含む機械可読媒体と、
    を含むシステム。
  20. 複数の画像を代表する合成画像を表示するための処理をコンピュータに実行させるプログラムであって、前記プログラムはコンピュータに、
    (a)「ズーム」および「スクラブ」パラメータを選択し、
    (b)前記パラメータに基づく前記複数の画像から表示画像のセットを生成し、
    (c)1以上の画像境界を選択し、
    (d)前記複数の画像境界に基づく合成境界を決定し、
    (e)前記表示画像のセットと前記合成境界に基づく合成画像を生成し、
    (f)前記合成画像を表示すること、
    を含む処理を実行させる、プログラム。
JP2006302552A 2005-11-08 2006-11-08 多数の画像のブラウズ方法、装置、システム、及びプログラム Pending JP2007133878A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US73505405P 2005-11-08 2005-11-08
US11/405,132 US20070104390A1 (en) 2005-11-08 2006-04-17 Methods for browsing multiple images

Publications (1)

Publication Number Publication Date
JP2007133878A true JP2007133878A (ja) 2007-05-31

Family

ID=38003814

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006302552A Pending JP2007133878A (ja) 2005-11-08 2006-11-08 多数の画像のブラウズ方法、装置、システム、及びプログラム

Country Status (2)

Country Link
US (1) US20070104390A1 (ja)
JP (1) JP2007133878A (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007206919A (ja) * 2006-02-01 2007-08-16 Sony Corp 表示制御装置および方法、プログラム、並びに記録媒体
US20080019661A1 (en) * 2006-07-18 2008-01-24 Pere Obrador Producing output video from multiple media sources including multiple video sources
US7787679B2 (en) * 2006-11-22 2010-08-31 Agfa Healthcare Inc. Study navigation system and method
US20090220165A1 (en) * 2008-02-29 2009-09-03 Microsoft Corporation Efficient image displaying
KR101527387B1 (ko) * 2009-03-09 2015-06-09 삼성전자 주식회사 디스플레이장치 및 그 제어방법
US9152318B2 (en) 2009-11-25 2015-10-06 Yahoo! Inc. Gallery application for content viewing
US20130108157A1 (en) * 2011-10-28 2013-05-02 Raymond William Ptucha Image Recomposition From Face Detection And Facial Features
US20130108167A1 (en) * 2011-10-28 2013-05-02 Raymond William Ptucha Image Recomposition From Face Detection And Facial Features
US9459774B1 (en) * 2013-01-23 2016-10-04 Mohammed Zulfikar Ali Time-based image display
US20210136135A1 (en) * 2019-10-31 2021-05-06 Sony Interactive Entertainment Inc. Image stabilization cues for accessible game stream viewing

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06110645A (ja) * 1992-09-29 1994-04-22 Oki Electric Ind Co Ltd 画像表示制御方法
JP2002328802A (ja) * 2001-05-07 2002-11-15 Ricoh Co Ltd ウィンドウ表示制御方法
JP2004015286A (ja) * 2002-06-05 2004-01-15 Seiko Epson Corp ディジタルカメラ

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6915489B2 (en) * 2001-03-28 2005-07-05 Hewlett-Packard Development Company, L.P. Image browsing using cursor positioning
JP4235393B2 (ja) * 2002-03-11 2009-03-11 富士フイルム株式会社 インデックス画像表示制御装置
US20040268393A1 (en) * 2003-05-08 2004-12-30 Hunleth Frank A. Control framework with a zoomable graphical user interface for organizing, selecting and launching media items
KR20060047930A (ko) * 2004-05-17 2006-05-18 마츠시타 덴끼 산교 가부시키가이샤 화상 합성 출력 장치, 화상 합성 표시 장치, 휴대통신기기,화상 합성 출력 방법 및 화상 합성 출력용 기록 매체
US7656399B2 (en) * 2004-09-03 2010-02-02 Fujifilm Corporation Displaying apparatus, a displaying method, and a machine readable medium storing thereon a computer program
US20060268129A1 (en) * 2005-05-26 2006-11-30 Yining Deng Composite images

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06110645A (ja) * 1992-09-29 1994-04-22 Oki Electric Ind Co Ltd 画像表示制御方法
JP2002328802A (ja) * 2001-05-07 2002-11-15 Ricoh Co Ltd ウィンドウ表示制御方法
JP2004015286A (ja) * 2002-06-05 2004-01-15 Seiko Epson Corp ディジタルカメラ

Also Published As

Publication number Publication date
US20070104390A1 (en) 2007-05-10

Similar Documents

Publication Publication Date Title
JP2007133878A (ja) 多数の画像のブラウズ方法、装置、システム、及びプログラム
US8095892B2 (en) Graphical user interface for 3-dimensional view of a data collection based on an attribute of the data
US7737995B2 (en) Graphical user interface system and process for navigating a set of images
US5943679A (en) Multi-page document viewer having a focus image and recursively nested images of varying resolutions less than the resolution of the focus image
US7992103B2 (en) Scaling icons for representing files
US11567624B2 (en) Techniques to modify content and view content on mobile devices
US8775953B2 (en) Collage display of image projects
US8261191B2 (en) Multi-point representation
US8255815B2 (en) Motion picture preview icons
US20130124980A1 (en) Framework for creating interactive digital content
US20060212833A1 (en) Radial, three-dimensional hierarchical file system view
US20070182999A1 (en) Photo browse and zoom
US20050240878A1 (en) System and method for scaling icons
JP2003271665A (ja) 検索用グラフィカル・ユーザ・インターフェイス
KR20060069497A (ko) 작은 디스플레이 창에서 큰 객체들의 개선된 표현법
US20120290925A1 (en) Incremental Graphic Object Layout Editing
EP1755051A1 (en) Method and apparatus for accessing data using a symbolic representation space
Brivio et al. PileBars: Scalable Dynamic Thumbnail Bars.
JP2004213429A (ja) 画像処理装置、画像処理プログラム、記録媒体、および画像処理方法
JP4736081B2 (ja) コンテンツ閲覧システム、コンテンツサーバ、プログラムおよび記憶媒体
EP1621988A2 (en) Three-Dimensional Motion Graphic User Interface and method and apparatus for providing the same.
Karstens et al. Presenting large and complex information sets on mobile handhelds

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091023

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110512

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110517

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111011