JP2005196481A - 画像形成装置、画像形成方法、およびプログラム - Google Patents
画像形成装置、画像形成方法、およびプログラム Download PDFInfo
- Publication number
- JP2005196481A JP2005196481A JP2004002226A JP2004002226A JP2005196481A JP 2005196481 A JP2005196481 A JP 2005196481A JP 2004002226 A JP2004002226 A JP 2004002226A JP 2004002226 A JP2004002226 A JP 2004002226A JP 2005196481 A JP2005196481 A JP 2005196481A
- Authority
- JP
- Japan
- Prior art keywords
- balloon
- image
- comment
- subject
- main subject
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Abstract
【課題】 撮影時の状況をリアルに再現することの可能な電子アルバムを効率的に作成できるようにする。
【解決手段】 画像とコメントを管理するアルバムデータを記憶するアルバムデータ記憶部11と、アルバムデータで管理される画像を取得する画像取得部12と、取得された画像の中から主要被写体を特定する主要被写体特定部13と、特定された主要被写体の情報を画像解析情報として記憶する画像解析情報記憶部14と、主要被写体の中から発言主体を特定する発言主体特定部15と、発言主体の位置に基づきフキダシを生成する領域を決定する領域決定部16と、決定された領域にフキダシを生成するフキダシ生成部17とを備えた。
【選択図】 図2
【解決手段】 画像とコメントを管理するアルバムデータを記憶するアルバムデータ記憶部11と、アルバムデータで管理される画像を取得する画像取得部12と、取得された画像の中から主要被写体を特定する主要被写体特定部13と、特定された主要被写体の情報を画像解析情報として記憶する画像解析情報記憶部14と、主要被写体の中から発言主体を特定する発言主体特定部15と、発言主体の位置に基づきフキダシを生成する領域を決定する領域決定部16と、決定された領域にフキダシを生成するフキダシ生成部17とを備えた。
【選択図】 図2
Description
本発明は、画像に関するコメントを囲むためのフキダシをその画像に付加することが可能な画像形成装置等に関する。なお、「フキダシ」とは、漫画等で用いられる表現技法であり、人物の口から吹き出すような形で描かれる台詞の囲みのことをいう。
撮影した写真からアルバムを作成することは、従来から広く行われている。また、近年では、写真がデジタルデータとして扱えるようになったことから、パーソナルコンピュータ等で電子アルバム作成ソフトウェアを動作させて、効率的にアルバムを作成することも可能になっている。
ところで、アルバムにおいては、写真を撮影した時の状況を後々鮮明に思い起こすことができるように、様々なコメントを写真に添えて残しておくことが多い。そのようなコメントは、紙の写真を用いたアルバムでは、写真とは別の紙片に記入してアルバムに貼り付けていた。一方、電子アルバム作成ソフトウェアでは、画面上にコメント枠を表示し、その中に自由にコメントを記入できるようにする工夫もなされている(例えば、特許文献1参照。)。
ところで、アルバムにおいては、写真を撮影した時の状況を後々鮮明に思い起こすことができるように、様々なコメントを写真に添えて残しておくことが多い。そのようなコメントは、紙の写真を用いたアルバムでは、写真とは別の紙片に記入してアルバムに貼り付けていた。一方、電子アルバム作成ソフトウェアでは、画面上にコメント枠を表示し、その中に自由にコメントを記入できるようにする工夫もなされている(例えば、特許文献1参照。)。
しかしながら、特許文献1に記載されたような、コメント枠にコメントを記入する方法では、コメントが常にアルバム作成者の視点からの説明的なものとなってしまい、アルバムとしての面白さに欠けるという問題点があった。写真を撮影した時の被写体の発言を、アルバム上でも実際にその被写体が発言しているかのような表現方法で残しておいた方が、撮影時の状況をリアルに再現するアルバムを作成する観点からは好まれることもある。
本発明は、以上のような技術的課題を解決するためになされたものであって、その目的は、撮影時の状況をリアルに再現することの可能な電子アルバムを効率的に作成できるようにすることにある。
かかる目的のもと、本発明は、画像上のフキダシを生成する位置を、画像から抽出された主要被写体との関係で自動的に決定するようにしている。即ち、本発明の画像形成装置は、画像に関するコメントを囲むためのフキダシの生成要求に応じて、その画像上で主要被写体を特定する主要被写体特定部と、この主要被写体特定部により特定された主要被写体の画像上での位置に基づき、フキダシを生成する領域を決定する領域決定部と、この領域決定部により決定された領域にフキダシを生成するフキダシ生成部とを備えている。
また、本発明は、画像上のフキダシを生成する位置を、画像から抽出された主要被写体との関係で自動的に決定する方法として捉えることもできる。その場合、本発明の画像形成方法は、画像に関するコメントを囲むためのフキダシの生成要求に応じて、その画像上で主要被写体を特定するステップと、特定された主要被写体の画像上での位置に基づき、フキダシを生成する領域を決定するステップと、決定された領域にフキダシを生成するステップとを含んでいる。
一方、本発明は、画像上のフキダシを生成する位置を、画像から抽出された主要被写体との関係で自動的に決定する機能をコンピュータに実現させるためのコンピュータプログラムとして捉えることもできる。その場合、本発明のプログラムは、コンピュータに、画像に関するコメントを囲むためのフキダシの生成要求に応じて、その画像上で主要被写体を特定する機能と、特定された主要被写体の画像上での位置に基づき、フキダシを生成する領域を決定する機能と、決定された領域にフキダシを生成する機能とを実現させる。
本発明によれば、撮影時の状況をリアルに再現することの可能な電子アルバムを効率的に作成することが可能となる。
以下、添付図面を参照して、本発明の実施の形態について詳細に説明する。
図1は、本発明の実施の形態が適用される画像形成装置のハードウェア構成の一例を示したものである。この画像形成装置は、処理部10と、スキャナ部20と、プリンタ部30と、メディアリーダ40と、UI(ユーザインターフェース)部50と、記憶装置60とから構成される。
図1は、本発明の実施の形態が適用される画像形成装置のハードウェア構成の一例を示したものである。この画像形成装置は、処理部10と、スキャナ部20と、プリンタ部30と、メディアリーダ40と、UI(ユーザインターフェース)部50と、記憶装置60とから構成される。
処理部10は、例えば、パーソナルコンピュータであり、図示しないが、中央処理装置(CPU)、メインメモリ、これらを結合するバス等を含んでいる。スキャナ部20は、プラテン上に配置された原稿を読み取って処理部10に伝える手段であり、プリンタ部30は、処理部10から伝えられたイメージを用紙に転写して出力する手段である。
メディアリーダ40は、フラッシュメモリ等のデジタルカメラ等で用いられる記録媒体から、電子アルバム上に配置する画像を読み出す機能を有するものである。また、画像に関するコメントが、例えば、テキスト情報として記録されている場合、メディアリーダ40は、そのコメントを同時に読み出すことも可能である。
UI部50は、ユーザが処理部10にデータを入力したり、処理部10がユーザに情報を提示したりするために用いられる部分であり、例えば、タッチパネルディスプレイである。
メディアリーダ40は、フラッシュメモリ等のデジタルカメラ等で用いられる記録媒体から、電子アルバム上に配置する画像を読み出す機能を有するものである。また、画像に関するコメントが、例えば、テキスト情報として記録されている場合、メディアリーダ40は、そのコメントを同時に読み出すことも可能である。
UI部50は、ユーザが処理部10にデータを入力したり、処理部10がユーザに情報を提示したりするために用いられる部分であり、例えば、タッチパネルディスプレイである。
記憶装置60は、例えば、ハードディスクデバイス(HDD)であり、種々の情報を記憶する。その1つは、アルバムデータである。ここで、アルバムデータとは、電子アルバム上に配置する画像のデータと、画像に関するコメントのデータと、これらのデータをどのように配置して電子アルバムを構成するかを示す管理情報とからなるデータである。また、処理部10に後述する各機能を実現させるコンピュータプログラムも記憶される。このコンピュータプログラムは、記録媒体からインストールされたものであってもよいし、インターネット等の通信回線を介してダウンロード後、インストールされたものであってもよい。さらに、このコンピュータプログラムが用いるデータも記憶される。
なお、このハードウェア構成はあくまで一例であり、これらの構成の全てを備えたシステムのみに限定するものではない。例えば、図1では、プリンタ機能に加えてコピー機能をも有する複合機を想定しているため、スキャナ部20が備わっているが、これを備えないシステムであってもよい。
また、画像形成装置は、図1に示すように、LAN(Local Area Network)、WAN(Wide Area Network)等のネットワークに接続されていてもよい。
また、画像形成装置は、図1に示すように、LAN(Local Area Network)、WAN(Wide Area Network)等のネットワークに接続されていてもよい。
次に、図2を参照して、本実施の形態における処理部10の機能構成を説明する。
図2に示すように、処理部10は、アルバムデータ記憶部11と、画像取得部12と、主要被写体特定部13と、画像解析情報記憶部14と、発言主体特定部15と、領域決定部16と、フキダシ生成部17とを備えている。
アルバムデータ記憶部11は、アルバムデータを記憶する部分であり、画像取得部12は、アルバムデータ記憶部11に記憶されたアルバムデータの中から指定された画像を取得する部分である。主要被写体特定部13は、画像取得部12が取得した画像を解析し、フキダシを付加する対象となり得る主要被写体を特定する部分であり、画像解析情報記憶部14は、主要被写体特定部13による解析結果である画像解析情報を記憶する部分である。
発言主体特定部15は、主要被写体特定部13が特定した主要被写体の中から、フキダシを付する対象とする1の被写体を発言主体として特定する部分であり、領域決定部16は、発言主体特定部15が特定した発言主体に対し、左、右、上、下等のどの領域にフキダシを生成するかを決定する部分である。フキダシ生成部17は、領域決定部16が決定した領域にフキダシを生成する部分である。
図2に示すように、処理部10は、アルバムデータ記憶部11と、画像取得部12と、主要被写体特定部13と、画像解析情報記憶部14と、発言主体特定部15と、領域決定部16と、フキダシ生成部17とを備えている。
アルバムデータ記憶部11は、アルバムデータを記憶する部分であり、画像取得部12は、アルバムデータ記憶部11に記憶されたアルバムデータの中から指定された画像を取得する部分である。主要被写体特定部13は、画像取得部12が取得した画像を解析し、フキダシを付加する対象となり得る主要被写体を特定する部分であり、画像解析情報記憶部14は、主要被写体特定部13による解析結果である画像解析情報を記憶する部分である。
発言主体特定部15は、主要被写体特定部13が特定した主要被写体の中から、フキダシを付する対象とする1の被写体を発言主体として特定する部分であり、領域決定部16は、発言主体特定部15が特定した発言主体に対し、左、右、上、下等のどの領域にフキダシを生成するかを決定する部分である。フキダシ生成部17は、領域決定部16が決定した領域にフキダシを生成する部分である。
次に、図3を参照しながら、本実施の形態における処理部10の動作について説明する。まず、動作の開始に先立ち、アルバムデータ記憶部11にはアルバムデータが記憶されているものとする。
例えば、新規に電子アルバムを作成する場合、処理部10は、記録媒体に記録された画像とコメントとをメディアリーダ40を介して読み込み、各画像およびコメントをアルバム領域上の既定の位置に配置してUI部50に表示する。この場合は、その表示されたアルバム領域の構成に関する情報がアルバムデータとしてアルバムデータ記憶部11に記憶される。
また、一回作成された電子アルバムの編集を行う場合、処理部10は、記憶装置60からアルバムデータを読み込み、アルバムデータ記憶部11に展開する。
このような状態で、ある画像に対し、コメントをフキダシの形式で付加する指示がなされると、図3に示した処理が行われる。
例えば、新規に電子アルバムを作成する場合、処理部10は、記録媒体に記録された画像とコメントとをメディアリーダ40を介して読み込み、各画像およびコメントをアルバム領域上の既定の位置に配置してUI部50に表示する。この場合は、その表示されたアルバム領域の構成に関する情報がアルバムデータとしてアルバムデータ記憶部11に記憶される。
また、一回作成された電子アルバムの編集を行う場合、処理部10は、記憶装置60からアルバムデータを読み込み、アルバムデータ記憶部11に展開する。
このような状態で、ある画像に対し、コメントをフキダシの形式で付加する指示がなされると、図3に示した処理が行われる。
まず、画像取得部12は、アルバムデータ記憶部11に記憶されたアルバムデータを参照し、指定された画像を取得する(ステップ101)。
次に、主要被写体特定部13は、画像取得部12が取得した画像を解析し、その結果を画像解析情報記憶部14に記憶する(ステップ102)。具体的には、フキダシを付する対象である主要被写体、例えば、人物の顔を抽出し、その位置情報を画像解析情報として記憶する。そして、人物が何人抽出されたかを判断する(ステップ103)。
次に、主要被写体特定部13は、画像取得部12が取得した画像を解析し、その結果を画像解析情報記憶部14に記憶する(ステップ102)。具体的には、フキダシを付する対象である主要被写体、例えば、人物の顔を抽出し、その位置情報を画像解析情報として記憶する。そして、人物が何人抽出されたかを判断する(ステップ103)。
人物が1人も抽出されなかった場合、画像に対するコメントを普通の形式で表示するような設定がなされる(ステップ104)。
一方、人物が1人だけ抽出された場合、発言主体特定部15は、その人物を、フキダシを付する対象に決定する(ステップ105)。そして、領域決定部16が、その人物とアルバム領域の末端や他の画像との間隔に基づき、その人物の左、右、上、下等のいずれの領域にフキダシを配置するかを決定し、フキダシ生成部17に伝える(ステップ106)。これにより、フキダシ生成部17は、コメントを囲むためのフキダシがその決定された領域に表示されるように設定する(ステップ109)。
また、人物が2人以上抽出された場合、発言主体特定部15は、それらの人物の中からフキダシを付する1人の人物を特定する(ステップ107)。そして、領域決定部16が、その人物とアルバム領域の末端や他の画像、さらには、他の人物との間隔に基づき、その人物の左、右、上、下等のいずれの領域にフキダシを配置するかを決定し、フキダシ生成部17に伝える(ステップ108)。これにより、フキダシ生成部17は、コメントを囲むためのフキダシがその決定された領域に表示されるように設定する(ステップ109)。
一方、人物が1人だけ抽出された場合、発言主体特定部15は、その人物を、フキダシを付する対象に決定する(ステップ105)。そして、領域決定部16が、その人物とアルバム領域の末端や他の画像との間隔に基づき、その人物の左、右、上、下等のいずれの領域にフキダシを配置するかを決定し、フキダシ生成部17に伝える(ステップ106)。これにより、フキダシ生成部17は、コメントを囲むためのフキダシがその決定された領域に表示されるように設定する(ステップ109)。
また、人物が2人以上抽出された場合、発言主体特定部15は、それらの人物の中からフキダシを付する1人の人物を特定する(ステップ107)。そして、領域決定部16が、その人物とアルバム領域の末端や他の画像、さらには、他の人物との間隔に基づき、その人物の左、右、上、下等のいずれの領域にフキダシを配置するかを決定し、フキダシ生成部17に伝える(ステップ108)。これにより、フキダシ生成部17は、コメントを囲むためのフキダシがその決定された領域に表示されるように設定する(ステップ109)。
以下、本実施の形態の動作について、具体例を用いて説明する。
本具体例では、図4に示すようなアルバムイメージがUI部50に表示されているものとする。この段階では、画像51、53、55にそれぞれ対応するコメント52、54、56は、フキダシの形式ではなく、通常の形式で表示されている。
また、このようなアルバムイメージを表示するために、図5に示すようなアルバムデータがアルバムデータ記憶部11に記憶されている。
本具体例では、図4に示すようなアルバムイメージがUI部50に表示されているものとする。この段階では、画像51、53、55にそれぞれ対応するコメント52、54、56は、フキダシの形式ではなく、通常の形式で表示されている。
また、このようなアルバムイメージを表示するために、図5に示すようなアルバムデータがアルバムデータ記憶部11に記憶されている。
ここで、図5のアルバムデータについて詳細に説明しておく。
まず、アルバムデータには、アルバム領域のサイズを示す情報を含むヘッダ部分が存在する(図5では、第1行目)。図5に示すように、ヘッダ部分には、アルバム領域の横幅HA、縦幅VAが記憶されている。
また、ヘッダに続けて、各画像とそれに対するコメントを管理するための部分が存在する(図5では、第2行目〜第4行目)。例えば、画像51およびコメント52について、画像51の左下の点のX座標XP1、Y座標YP1、横幅HP1、縦幅VP1、実際の画像データが格納された領域へのポインタPTRP1、画像データの長さLENP1、コメント52の枠の左下の点のX座標XT1、Y座標YT1、横幅HT1、縦幅VT1、実際のコメントデータが格納された領域へのポインタPTRT1、コメントデータの長さLENT1、コメントを囲む枠の種類が記憶されている。画像53およびコメント54、画像55およびコメント56についても同様である。
さらに、これらの管理情報に続けて、実際の画像のデータおよびコメントデータを格納する領域が存在する。
まず、アルバムデータには、アルバム領域のサイズを示す情報を含むヘッダ部分が存在する(図5では、第1行目)。図5に示すように、ヘッダ部分には、アルバム領域の横幅HA、縦幅VAが記憶されている。
また、ヘッダに続けて、各画像とそれに対するコメントを管理するための部分が存在する(図5では、第2行目〜第4行目)。例えば、画像51およびコメント52について、画像51の左下の点のX座標XP1、Y座標YP1、横幅HP1、縦幅VP1、実際の画像データが格納された領域へのポインタPTRP1、画像データの長さLENP1、コメント52の枠の左下の点のX座標XT1、Y座標YT1、横幅HT1、縦幅VT1、実際のコメントデータが格納された領域へのポインタPTRT1、コメントデータの長さLENT1、コメントを囲む枠の種類が記憶されている。画像53およびコメント54、画像55およびコメント56についても同様である。
さらに、これらの管理情報に続けて、実際の画像のデータおよびコメントデータを格納する領域が存在する。
まず、図4の画像51に対し、コメント52をフキダシの形式で表示する指示がなされたとして、図3の動作を説明する。
この場合、ステップ101で、画像取得部12が、図5のPTRP1、LENP1を参照し、画像51のデータを取得する。次に、ステップ102で、主要被写体特定部13が、画像51から人物の抽出を試みる。しかしながら、この例の場合は、人物は抽出されない。従って、ステップ103での判断は「0」となり、ステップ104に進み、図5のアルバムデータを、コメント52が普通の形式で表示されるような設定とする。なお、本具体例では、最初からコメント52は普通の形式で表示されていたので、図4のアルバムイメージおよび図5のアルバムデータが変更されることはない。
この場合、ステップ101で、画像取得部12が、図5のPTRP1、LENP1を参照し、画像51のデータを取得する。次に、ステップ102で、主要被写体特定部13が、画像51から人物の抽出を試みる。しかしながら、この例の場合は、人物は抽出されない。従って、ステップ103での判断は「0」となり、ステップ104に進み、図5のアルバムデータを、コメント52が普通の形式で表示されるような設定とする。なお、本具体例では、最初からコメント52は普通の形式で表示されていたので、図4のアルバムイメージおよび図5のアルバムデータが変更されることはない。
次に、図4の画像53に対し、コメント54をフキダシの形式で表示する指示がなされたとして、図3の動作を説明する。
この場合、ステップ101で、画像取得部12が、図5のPTRP2、LENP2を参照し、画像53のデータを取得する。次に、ステップ102で、主要被写体特定部13が、画像53から人物の抽出を試みる。この例の場合、人物は1人だけ抽出されるので、解析結果としては、図6(A)に示すように、その人物に関する情報のみが画像解析情報記憶部14に記憶される。
この場合、ステップ101で、画像取得部12が、図5のPTRP2、LENP2を参照し、画像53のデータを取得する。次に、ステップ102で、主要被写体特定部13が、画像53から人物の抽出を試みる。この例の場合、人物は1人だけ抽出されるので、解析結果としては、図6(A)に示すように、その人物に関する情報のみが画像解析情報記憶部14に記憶される。
図6(A)の画像解析情報は、少なくとも抽出された人物の位置情報を含んでいる。この位置情報としては、如何なるものを用いてもよいが、図6(A)では、画像53の左下の点を原点とした場合のその人物の顔の中心の座標(x2,y2)をアルバム領域上の座標に変換して得られた座標(XP2+x2,YP2+y2)と、顔の半径r2とが記憶される。
この場合、ステップ103での判断は「1」となり、ステップ105に進み、その人物にフキダシを付けることを決定する。そして、ステップ106で、その人物と、アルバム領域の末端、他の画像との間隔に基づき、その人物の左、右、上、下等のいずれの領域にフキダシを生成するかを決定する。
この場合、ステップ103での判断は「1」となり、ステップ105に進み、その人物にフキダシを付けることを決定する。そして、ステップ106で、その人物と、アルバム領域の末端、他の画像との間隔に基づき、その人物の左、右、上、下等のいずれの領域にフキダシを生成するかを決定する。
このフキダシを生成する領域の決定方法についてさらに詳しく述べる。
本実施の形態では、フキダシを付する人物の周囲の最も大きなフキダシを配置可能な領域を、フキダシを生成する領域として決定することとする。
まず、画像53の人物の左側にフキダシを生成することとした場合、アルバム領域の左端からその人物までの距離、画像53の縦幅を、それぞれ横幅、縦幅とするフキダシが作成可能である。その面積は、(XP2+x2−r2)×VP2となる。
また、画像53の人物の右側にフキダシを生成することとした場合、アルバム領域の右端からその人物までの距離、画像53の縦幅を、それぞれ横幅、縦幅とするフキダシが作成可能である。その面積は、(HA−XP2−x2−r2)×VP2となる。
また、画像53の人物の上側にフキダシを生成することとした場合、アルバム領域の横幅、画像51の下端からその人物までの距離を、それぞれ横幅、縦幅とするフキダシが作成可能である。その面積は、HA×(YP1−YP2−y2−r2)となる。
さらに、画像53の人物の下側にフキダシを生成することとした場合、アルバム領域の横幅、画像55の上端からその人物までの距離を、それぞれ横幅、縦幅とするフキダシが作成可能である。その面積は、HA×(YP2+y2−r2−YP3−VP3)となる。
本実施の形態では、フキダシを付する人物の周囲の最も大きなフキダシを配置可能な領域を、フキダシを生成する領域として決定することとする。
まず、画像53の人物の左側にフキダシを生成することとした場合、アルバム領域の左端からその人物までの距離、画像53の縦幅を、それぞれ横幅、縦幅とするフキダシが作成可能である。その面積は、(XP2+x2−r2)×VP2となる。
また、画像53の人物の右側にフキダシを生成することとした場合、アルバム領域の右端からその人物までの距離、画像53の縦幅を、それぞれ横幅、縦幅とするフキダシが作成可能である。その面積は、(HA−XP2−x2−r2)×VP2となる。
また、画像53の人物の上側にフキダシを生成することとした場合、アルバム領域の横幅、画像51の下端からその人物までの距離を、それぞれ横幅、縦幅とするフキダシが作成可能である。その面積は、HA×(YP1−YP2−y2−r2)となる。
さらに、画像53の人物の下側にフキダシを生成することとした場合、アルバム領域の横幅、画像55の上端からその人物までの距離を、それぞれ横幅、縦幅とするフキダシが作成可能である。その面積は、HA×(YP2+y2−r2−YP3−VP3)となる。
ステップ106では、領域決定部16がこの中の1つをフキダシを生成する領域として決定し、ステップ109で、フキダシ生成部17がその領域にフキダシを生成する。例えば、右側に最も大きなフキダシを生成可能だとすると、フキダシに入れるコメントの文字数等に基づき適宜調整し、図7にフキダシ54fとして示すような表示を行う。また、この時、アルバムデータに対しては、図8の第3行目に示すように、フキダシ54fの位置情報(XfT2,YfT2,HfT2,VfT2)を記憶する。また、コメント54をフキダシの形式で表示する指示がなされた際に選択されたフキダシの種類が「フキダシ#1」だとすると、コメントを表示する形式として「フキダシ#1」が記憶される。
次に、図4の画像55に対し、コメント56をフキダシの形式で表示する指示がなされたとして、図3の動作を説明する。
この場合、ステップ101で、画像取得部12が、図5のPTRP3、LENP3を参照し、画像55のデータを取得する。次に、ステップ102で、主要被写体特定部13が、画像55から人物の抽出を試みる。この例の場合、人物は3人抽出されるので、解析結果としては、図6(B)に示すように、それら3人の人物に関する情報が画像解析情報記憶部14に記憶される。
この場合、ステップ101で、画像取得部12が、図5のPTRP3、LENP3を参照し、画像55のデータを取得する。次に、ステップ102で、主要被写体特定部13が、画像55から人物の抽出を試みる。この例の場合、人物は3人抽出されるので、解析結果としては、図6(B)に示すように、それら3人の人物に関する情報が画像解析情報記憶部14に記憶される。
図6(B)の画像解析情報は、少なくとも抽出された人物の位置情報を含んでいる。この位置情報としては、如何なるものを用いてもよいが、図6(B)では、画像55の左下の点を原点とした場合のその人物の顔の中心の座標をアルバム領域上の座標に変換して得られた座標と、顔の半径とが記憶される。つまり、向かって左側の人物については、顔の中心の座標(XP3+x31,YP3+y31)と顔の半径r31とが、中央の人物については、顔の中心の座標(XP3+x32,YP3+y32)と顔の半径r32とが、向かって右側の人物については、顔の中心の座標(XP3+x33,YP3+y33)と顔の半径r33とが記憶される。
この場合、ステップ103での判断は「2以上」となり、ステップ107に進み、それら3人の人物の中からフキダシを付ける人物を特定する。
ここで、フキダシを付ける人物の特定方法としては、例えば、以下のような方法がある。
第一に、フキダシを付する人物をユーザに問い合わせて指定させる方法がある。例えば、「3人の人物が検出されました。どの人物にフキダシを付けますか。1:一番左の人物、2:中央の人物、3:一番右の人物。」等のメッセージを出力して指定させる方法が考えられる。
第二に、フキダシを付する人物をマウス等のポインティングデバイスを用いて指定する方法がある。例えば、フキダシの図形をポインティングデバイスでドラッグし、フキダシを付したい人物の顔の部分でドラッグすることにより、指定することができる。
ここで、フキダシを付ける人物の特定方法としては、例えば、以下のような方法がある。
第一に、フキダシを付する人物をユーザに問い合わせて指定させる方法がある。例えば、「3人の人物が検出されました。どの人物にフキダシを付けますか。1:一番左の人物、2:中央の人物、3:一番右の人物。」等のメッセージを出力して指定させる方法が考えられる。
第二に、フキダシを付する人物をマウス等のポインティングデバイスを用いて指定する方法がある。例えば、フキダシの図形をポインティングデバイスでドラッグし、フキダシを付したい人物の顔の部分でドラッグすることにより、指定することができる。
第三に、コメントが音声で入力された場合において、画像上の人物の顔の特徴とコメントの音声の特徴とのマッチングにより人物を特定する方法がある。この場合は、ステップ102で画像を解析する際に、顔の特徴も解析し、図6(B)に示すように、特徴情報として記憶しておく必要がある。また、各人物の顔の特徴情報と音声の特徴情報とを対応付けた顔・音声テーブルを事前に登録しておく必要もある。その状態で、まず、フキダシにしたいコメントについて、音声の特徴に基づき、顔・音声テーブルを検索し、その音声に対応する顔の特徴を幾つか候補として取得する。そして、これらの候補の中に図6(B)に記憶された特徴情報と類似度が高い特徴情報を有するものがあれば、その候補をフキダシを付する対象として決定する。
なお、事前の顔・音声テーブルの登録は、頻繁に被写体となる人物について、予めサンプル画像と音声を入力することによっても可能であるし、アルバム作成の際のユーザによるフキダシと特定の人物とを結びつける操作を学習することによっても可能である。
このようにしてフキダシを付ける人物が特定されると、ステップ108で、その人物と、アルバム領域の末端、他の画像、他の人物との間隔に基づき、その人物の左、右、上、下等のいずれの領域にフキダシを生成するかを決定する。
なお、事前の顔・音声テーブルの登録は、頻繁に被写体となる人物について、予めサンプル画像と音声を入力することによっても可能であるし、アルバム作成の際のユーザによるフキダシと特定の人物とを結びつける操作を学習することによっても可能である。
このようにしてフキダシを付ける人物が特定されると、ステップ108で、その人物と、アルバム領域の末端、他の画像、他の人物との間隔に基づき、その人物の左、右、上、下等のいずれの領域にフキダシを生成するかを決定する。
このフキダシを生成する領域の決定方法について、画像55の3人の人物のうち向かって右側の人物がフキダシを付する人物として特定されたものとして、詳しく説明する。
本実施の形態では、フキダシを付する人物の周囲の最も大きなフキダシを配置可能な領域を、フキダシを生成する領域として決定することとする。
まず、特定された人物の左側にフキダシを生成することとした場合、他の人物の顔にフキダシがかかってしまうので、左側にはフキダシは作成不可能であると判断する。
また、特定された人物の右側にフキダシを生成することとした場合、アルバム領域の右端からその人物までの距離、画像55の縦幅を、それぞれ横幅、縦幅とするフキダシが作成可能である。その面積は、(HA−XP3−x33−r33)×VP3となる。
また、特定された人物の上側にフキダシを生成することとした場合、アルバム領域の横幅、画像53の下端からその人物までの距離を、それぞれ横幅、縦幅とするフキダシが作成可能である。その面積は、HA×(YP2−YP3−y33−r33)となる。
さらに、特定された人物の下側にフキダシを生成することとした場合、アルバム領域の横幅、アルバム領域の下端から中央の人物までの距離を、それぞれ横幅、縦幅とするフキダシが作成可能である。その面積は、HA×(YP3+y32−r32)となる。なお、この場合に、アルバム領域の下端から向かって右側の人物までの距離を縦幅としなかったのは、そのような領域にフキダシを生成した場合、中央の人物の顔が隠れてしまうためである。
本実施の形態では、フキダシを付する人物の周囲の最も大きなフキダシを配置可能な領域を、フキダシを生成する領域として決定することとする。
まず、特定された人物の左側にフキダシを生成することとした場合、他の人物の顔にフキダシがかかってしまうので、左側にはフキダシは作成不可能であると判断する。
また、特定された人物の右側にフキダシを生成することとした場合、アルバム領域の右端からその人物までの距離、画像55の縦幅を、それぞれ横幅、縦幅とするフキダシが作成可能である。その面積は、(HA−XP3−x33−r33)×VP3となる。
また、特定された人物の上側にフキダシを生成することとした場合、アルバム領域の横幅、画像53の下端からその人物までの距離を、それぞれ横幅、縦幅とするフキダシが作成可能である。その面積は、HA×(YP2−YP3−y33−r33)となる。
さらに、特定された人物の下側にフキダシを生成することとした場合、アルバム領域の横幅、アルバム領域の下端から中央の人物までの距離を、それぞれ横幅、縦幅とするフキダシが作成可能である。その面積は、HA×(YP3+y32−r32)となる。なお、この場合に、アルバム領域の下端から向かって右側の人物までの距離を縦幅としなかったのは、そのような領域にフキダシを生成した場合、中央の人物の顔が隠れてしまうためである。
ステップ108では、領域決定部16がこの中の1つをフキダシを生成する領域として決定し、ステップ109で、フキダシ生成部17がその領域にフキダシを生成する。例えば、右側に最も大きなフキダシを生成可能だとすると、フキダシに入れるコメントの文字数等に基づき適宜調整し、図7にフキダシ56fとして示すような表示を行う。また、この時、アルバムデータに対しては、図8の第4行目に示すように、フキダシ56fの位置情報(XfT3,YfT3,HfT3,VfT3)を記憶する。また、コメント56をフキダシの形式で表示する指示がなされた際に選択されたフキダシの種類が「フキダシ#2」だとすると、コメントを表示する形式として「フキダシ#2」が記憶される。
以上により、本実施の形態の動作は終了する。
以上により、本実施の形態の動作は終了する。
なお、本実施の形態では、フキダシを付する対象としては人物を主として説明したが、人間以外の動物や、植物、さらには生物の範疇に属さない物体に対しても、これらを擬人化し、フキダシを付する場合はある。フキダシを付する対象として如何なる物体を選択するかは、事前にパラメータとして設定しておき、主要被写体特定部13がこのパラメータで指定された主要被写体を抽出するようにする。
また、本実施の形態では、画像形成装置にて画像にフキダシを付する処理を行うこととしたが、パーソナルコンピュータ等においても、このような処理を行うことは可能である。
また、本実施の形態では、画像形成装置にて画像にフキダシを付する処理を行うこととしたが、パーソナルコンピュータ等においても、このような処理を行うことは可能である。
このように、本実施の形態では、電子アルバムの画像に付加するテキストをフキダシにして表示するようにした。これにより、撮影時の状況をリアルに再現することの可能な電子アルバムを作成することが可能となる。
また、画像に複数の主要被写体が含まれる場合のフキダシを付する主要被写体の特定や、フキダシを配置する領域の決定を自動的に行うようにしたことにより、このような電子アルバムの作成がより効率的に行うことが可能となる。
また、画像に複数の主要被写体が含まれる場合のフキダシを付する主要被写体の特定や、フキダシを配置する領域の決定を自動的に行うようにしたことにより、このような電子アルバムの作成がより効率的に行うことが可能となる。
10…処理部、11…アルバムデータ記憶部、12…画像取得部、13…主要被写体特定部、14…画像解析情報記憶部、15…発言主体特定部、16…領域決定部、17…フキダシ生成部、20…スキャナ部、30…プリンタ部、40…メディアリーダ、50…UI部、60…記憶装置
Claims (9)
- 画像に関するコメントを囲むためのフキダシの生成要求に応じて、当該画像上で主要被写体を特定する主要被写体特定部と、
前記主要被写体特定部により特定された前記主要被写体の前記画像上での位置に基づき、前記フキダシを生成する領域を決定する領域決定部と、
前記領域決定部により決定された前記領域に前記フキダシを生成するフキダシ生成部と
を備えたことを特徴とする画像形成装置。 - 前記主要被写体特定部により複数の前記主要被写体が特定された場合に、当該複数の主要被写体の中から、前記コメントの発言主体を特定する発言主体特定部をさらに備えたことを特徴とする請求項1記載の画像形成装置。
- 前記発言主体特定部は、前記複数の主要被写体のそれぞれの画像上の特徴と、前記コメントの音声上の特徴との比較結果に基づき、前記発言主体を特定することを特徴とする請求項2記載の画像形成装置。
- 前記領域決定部は、前記主要被写体の周囲の当該主要被写体が存在しない領域の中から、最も大きな前記フキダシを配置可能な領域を、前記フキダシを生成する領域として決定することを特徴とする請求項1記載の画像形成装置。
- 画像に関するコメントを囲むためのフキダシの生成要求に応じて、当該画像上で主要被写体を特定するステップと、
特定された前記主要被写体の前記画像上での位置に基づき、前記フキダシを生成する領域を決定するステップと、
決定された前記領域に前記フキダシを生成するステップと
を含むことを特徴とする画像形成方法。 - コンピュータに、
画像に関するコメントを囲むためのフキダシの生成要求に応じて、当該画像上で主要被写体を特定する機能と、
特定された前記主要被写体の前記画像上での位置に基づき、前記フキダシを生成する領域を決定する機能と、
決定された前記領域に前記フキダシを生成する機能と
を実現するためのプログラム。 - コンピュータに、
前記主要被写体を特定する機能で複数の前記主要被写体が特定された場合に、当該複数の主要被写体の中から、前記コメントの発言主体を特定する機能をさらに実現させることを特徴とする請求項6記載のプログラム。 - 前記発言主体を特定する機能では、前記複数の主要被写体のそれぞれの画像上の特徴と、前記コメントの音声上の特徴との比較結果に基づき、前記発言主体を特定させることを特徴とする請求項7記載のプログラム。
- 前記領域を決定する機能では、前記主要被写体の周囲の当該主要被写体が存在しない領域の中から、最も大きな前記フキダシを配置可能な領域を、前記フキダシを生成する領域として決定させることを特徴とする請求項6記載のプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004002226A JP2005196481A (ja) | 2004-01-07 | 2004-01-07 | 画像形成装置、画像形成方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004002226A JP2005196481A (ja) | 2004-01-07 | 2004-01-07 | 画像形成装置、画像形成方法、およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005196481A true JP2005196481A (ja) | 2005-07-21 |
Family
ID=34817510
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004002226A Withdrawn JP2005196481A (ja) | 2004-01-07 | 2004-01-07 | 画像形成装置、画像形成方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005196481A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007310487A (ja) * | 2006-05-16 | 2007-11-29 | Canon Inc | 画像処理装置、画像処理方法、プログラム及び記録媒体 |
JP2011086248A (ja) * | 2009-10-19 | 2011-04-28 | Canon Inc | 情報処理装置及び情報処理方法 |
JP2013088906A (ja) * | 2011-10-14 | 2013-05-13 | Cyber Ai Entertainment Inc | 画像認識システムを備えた知識情報処理サーバシステム |
US9015579B2 (en) | 2006-08-22 | 2015-04-21 | Fujifilm Corporation | Apparatus and program for efficiently generating electronic albums using templates selected based on image evaluation values |
-
2004
- 2004-01-07 JP JP2004002226A patent/JP2005196481A/ja not_active Withdrawn
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007310487A (ja) * | 2006-05-16 | 2007-11-29 | Canon Inc | 画像処理装置、画像処理方法、プログラム及び記録媒体 |
US9015579B2 (en) | 2006-08-22 | 2015-04-21 | Fujifilm Corporation | Apparatus and program for efficiently generating electronic albums using templates selected based on image evaluation values |
JP2011086248A (ja) * | 2009-10-19 | 2011-04-28 | Canon Inc | 情報処理装置及び情報処理方法 |
JP2013088906A (ja) * | 2011-10-14 | 2013-05-13 | Cyber Ai Entertainment Inc | 画像認識システムを備えた知識情報処理サーバシステム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8719029B2 (en) | File format, server, viewer device for digital comic, digital comic generation device | |
JP4833573B2 (ja) | 複合的な電子表現物を作成する方法、装置及びデータ処理システム | |
US20140164927A1 (en) | Talk Tags | |
JP2005092879A (ja) | プレゼンテーションの間にキャプチャされた情報を該プレゼンテーション用の紙文書配布物を用いてアクセスする手法 | |
JP5661663B2 (ja) | 情報抽出装置 | |
JP2004007358A (ja) | 同期コンテンツ情報生成プログラム、同期コンテンツ情報生成装置および同期コンテンツ情報生成方法 | |
JP5437340B2 (ja) | ビューワ装置、サーバ装置、表示制御方法、電子コミック編集方法及びプログラム | |
US20040076342A1 (en) | Automatic image placement and linking | |
JP5200065B2 (ja) | コンテンツ配信システム、方法およびプログラム | |
JP2008123265A (ja) | アイデア抽出支援システム及び方法 | |
JP2012038286A (ja) | コンテンツ解析装置、方法およびプログラム | |
JP2006025129A (ja) | 画像処理システム及び画像処理方法 | |
JP5164426B2 (ja) | 表示制御装置および表示制御方法 | |
JP5262888B2 (ja) | 文書表示制御装置及びプログラム | |
JP2005196481A (ja) | 画像形成装置、画像形成方法、およびプログラム | |
CN101334990A (zh) | 信息显示设备、显示系统和信息显示方法 | |
JP2008158777A (ja) | 画像処理装置及び方法、コンピュータプログラム及び記憶媒体 | |
JP6261198B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
JP4220458B2 (ja) | 画像表示装置 | |
JP4250983B2 (ja) | 連続データへのユーザデータ関連付け装置 | |
JP2003196638A (ja) | ファイリングデータのサムネイルキャプチャリングシステム及びプログラム | |
JP2010108296A (ja) | 情報処理装置、情報処理方法 | |
JP2002049925A (ja) | 漫画編集支援装置、漫画編集支援システム、および漫画編集支援プログラムを記録した記録媒体 | |
JP2004078923A (ja) | 漫画編集支援装置 | |
JP4983489B2 (ja) | 情報処理装置及び情報処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20061220 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20081015 |