JP4347007B2 - 情報処理装置およびプログラム - Google Patents

情報処理装置およびプログラム Download PDF

Info

Publication number
JP4347007B2
JP4347007B2 JP2003329169A JP2003329169A JP4347007B2 JP 4347007 B2 JP4347007 B2 JP 4347007B2 JP 2003329169 A JP2003329169 A JP 2003329169A JP 2003329169 A JP2003329169 A JP 2003329169A JP 4347007 B2 JP4347007 B2 JP 4347007B2
Authority
JP
Japan
Prior art keywords
image
audio data
data
displayed
image area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003329169A
Other languages
English (en)
Other versions
JP2005094711A (ja
Inventor
康之 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2003329169A priority Critical patent/JP4347007B2/ja
Publication of JP2005094711A publication Critical patent/JP2005094711A/ja
Application granted granted Critical
Publication of JP4347007B2 publication Critical patent/JP4347007B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Controls And Circuits For Display Device (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Television Signal Processing For Recording (AREA)
  • Studio Devices (AREA)

Description

本発明は、画像データに対して音声データを付加することができるプログラムおよび、画像データに付加されている音声データを出力することができるプログラムに関するものである。
近年、急速に普及しつつあるデジタルカメラは、従来の銀塩カメラが被写体像をフィルム面上に結像させ、画像を化学的にアナログ記録するのに対し、CCDセンサーなどの撮像素子によって撮像された画像をメモリカードなどの記録媒体に電気的にデジタル記録するものである。
デジタルカメラでは、ほとんどの機種で液晶モニタ等の画像を再生できる表示ユニットが設けられており、撮影後すぐに撮影画像を再生し、構図や露出を確認することができる。また、撮影画像を再生するときに画像の一部を拡大表示できるものもあり、ピントの確認も容易に行うことができる。
さらに、デジタルカメラでは、シャッタースピード、絞り値などの撮影条件に関する情報や、撮影日や撮影時刻また撮影時の気温など撮影状況に関する情報を、画像データとともに記録媒体に記録することができる。このため、上記の情報に基づいて撮影画像を整理したり、大量の撮影画像の中から所望の画像を探し出したりすることができ、銀塩写真に比べて撮影画像の整理を行いやすいといった特徴がある。
また、より詳しく撮影時の状況を記録するために画像データに音声を付加する機能を持ったデジタルカメラが提案されている。この付加された音声は、デジタルカメラあるいはパソコン等の機器で簡単に再生することができる。
ここで、使用者が撮影画像上の所望の座標を指定することによって、指定された座標に対応した特定の領域を選択し、この領域に対して音声データなどを付加できる電子スチルカメラがある(例えば、特許文献1、2参照)。
特開平5−284448号公報(段落番号0018、0024) 特開平6−217252号公報(段落番号0015、0018)
しかし、上述した特許文献1、2に開示されている電子スチルカメラでは、特定の領域(ノード)を選択するために、使用者に対して座標を指定させるといった、撮影画像を再生させる操作以外の操作を強いることになり、カメラの使い勝手が悪くなる。また、撮影画像の全領域のうち小さな領域を選択する際に、小さな領域に対応した座標を正確に指定することが困難であるといった問題がある。
本願第1の発明の情報処理装置は、画像データを表示させる表示手段と、前記表示手段により表示された画像データのうち一部の画像領域を拡大して表示させる拡大手段と、前記一部の画像領域を拡大して表示しているときに、音声入力の指示があると入力された音声データと、前記一部の画像領域とを関連付けるリンク情報を生成するリンク手段とを有することを特徴とする。
本願第2の発明の情報処理装置は、画像データを表示させるとともに、この表示された画像データのうち一部の画像領域に関連づけられた音声データを出力させる情報処理装置であって、複数の前記一部の画像領域をそれぞれ識別可能な状態で前記画像データと共に表示させる表示手段と、前記一部の表示領域を複数選択する選択手段と、前記選択手段により選択された前記複数の前記一部の画像領域に関連づけられた音声データをそれぞれ出力させるとともに、前記一部の画像領域を拡大して表示させる制御手段とを有し、前記制御手段は、前記音声データの録音時間の長さに応じて、前記選択手段により選択された前記複数の前記一部の画像領域に関連づけられた音声データの再生順番を決定することを特徴とする。
本願第1の発明によれば、画像データのうち一部の画像領域を拡大して表示しているときに、音声データを生成させるとともに、リンク情報を生成させることで、上記の一部の画像領域と音声データとを関連付けることができ、従来(特許文献1、2)のように音声データを付加するために画像データ内の座標を指定して一部の画像領域を選択するといった手間を省くことができる。しかも、一部の画像領域を拡大表示した状態のときに、音声データを生成しているため、画像データ内の小さな領域に対しても容易に音声データを関連付けることができる。
ここで、一部の画像領域を画像データ内で複数表示させることもでき、この場合には一部の画像領域を複数選択して、選択された画像領域を順次、拡大表示させることによって、複数の画像領域の確認を容易に行うことができる。
選択された画像領域を順次、拡大表示させる方法としては、例えば、音声データの生成された順番、音声データの生成時間又は生成時刻の順番、一部の画像領域の拡大倍率の順番、画像データに対する一部の画像領域の大きさの順番とすることができ、上記の拡大表示の順序を、使用者によって適宜設定することができるようにすれば、使用者に対して使い勝手の良いものとすることができる。
以下、本発明の実施例について説明する。
図1は、本発明の実施例1において、画像生成装置と画像/音声再生装置との関係を示す図である。
画像生成装置101は、物体像のデジタル画像を生成する機能と、生成されたデジタル画像を表示する機能と、表示されているデジタル画像と関連づけられる音声データを生成する機能とを有する装置である。この画像生成装置101としては、デジタルカメラ、デジタルビデオカメラ、スキャナなどの撮像装置、カメラユニットを有する電子機器がある。また、画像読み取りユニットを有するファクシミリ装置、複写機などの電子機器であってもよい。
画像/音声再生装置102は、画像生成装置101で生成されたデジタル画像を再生する機能と、デジタル画像に関連づけて記憶されている音声データを再生する機能とを有する装置である。画像/音声再生装置102としては、パーソナルコンピュータ等の電子機器がある。
ここで、画像生成装置101から画像/音声再生装置102へのデータ(画像データおよび音声データ)の転送は、デジタル画像および音声データが記録された記録媒体や、両装置101、102をつなぐケーブル、光通信等を介して行うことができる。
なお、画像生成装置101に、上記の画像/音声再生装置102における画像再生機能と、音声データ再生機能とを設けることもできる。また、画像/音声再生装置102に、画像生成装置101におけるデジタル画像を表示する機能と、表示されているデジタル画像と関連づけられる音声データを再生する機能を設けることもできる。
図2は、本実施例における画像生成装置101の主要な機能構成を説明するブロック図である。
制御部204は、プログラム記憶部206に予め格納されているプログラムに従って画像生成装置101における全体の動作を制御する。
撮像部201は、物体像を電気信号に変換して出力する撮像素子(例えば、CCDエリアセンサ、CMOSイメージセンサ)や、撮像素子からの出力信号(アナログ信号)をデジタル信号に変換して出力するA/D変換器等を含む。
画像処理部202は、撮像部201から出力された画像データに対して、画像処理パラメータに基づいた画像処理と圧縮処理(例えば、JPEG方式)を行う。また、画像処理部202は、後述するように圧縮された状態にある画像データを表示させる際に、この画像データに対して伸張処理を行う。
なお、画像処理パラメータとは、デジタル画像の画質に関するパラメータのことで、デジタル画像のホワイトバランス、色補間、色補正、γ変換、エッジ強調、記録方式または圧縮率に関するパラメータは全て画像処理パラメータに相当する。そして、これらのパラメータ(記録方式又は圧縮率に関するパラメータを除く)のうち少なくとも1つのパラメータを用いてデジタル画像の画質を調整(変更)する処理のことを画像処理と呼ぶ。
画像処理部202によって画像処理が施されたデータは、データバス210を介して、一旦メモリ部207に格納される。メモリ部207に格納された画像データは、制御部204によって読み出され、表示部205に出力される。これにより、使用者は表示部205を介して画像を確認することができる。
一方、メモリ部207に格納された画像データに対しては、図3(B)に示すように、画像処理パラメータなどの撮影情報を含むヘッダー情報が付加されて、画像ファイルが構成される。
この画像ファイルは、メモリカード・インタフェース(以下、I/Fと略する)209を介して画像生成装置101に着脱可能なメモリカード(PCMCIAカードやコンパクトフラッシュ(登録商標)等)212に書き込まれる。なお、メモリカード212に代えて、ハードディスク、マイクロDAT、光磁気ディスク、CD−R、CD−RW等の光ディスク、DVD等の相変化型光ディスク等を用いることができる。また、メモリカードとハードディスク等が一体となった複合媒体とすることもできる。
また、画像ファイルは、シリアルI/F208を介してシリアルバス211に出力でき、ネットワーク上での画像ファイルの配布や、画像/音声再生装置102への出力を容易に行うことができる。
また、メモリカード212に書き込まれた画像ファイル(画像)を表示部205で再生させるときには、制御部204はメモリカード212内に記録された画像ファイルをメモリカードI/F209を介して読み出し、メモリ部207へ格納した後、表示部205に出力する。
音声データ生成部203は、画像生成装置101の外部からの音の入力を受けて電気信号に変換するマイクロフォンと、マイクロフォンからの出力をA/D変換して出力するA/D変換器などを含む。この音声データ生成部203は、表示部205に画像が表示されているときに、マイクロフォンに入力された音声を音声データに変換して出力する。
音声データ生成部203から出力された音声データは、メモリ部207に格納される。ここで、制御部204は、表示部205に表示されている画像と音声データを関連づけるリンク情報を生成する。このリンク情報は、音声データとともにメモリカードI/F209を介してメモリカード212に書き込まれる。
リンク情報とは、音声データ生成部203で生成された音声データを識別するための「音声データファイル名」や、音声データの「生成日時」や、音声データに対応した画像データを識別するための「画像ファイル名」の情報や、音声データの記録時間を表す「録音時間」、又は、画像全体の領域のうちどの領域が拡大表示されているかを表す情報としての「拡大倍率」・「拡大表示領域の開始座標」・「拡大表示領域の終了座標」などを示す。ここで、「拡大表示領域の開始座標」および「拡大表示領域の終了座標」は、画像全体の領域のうち拡大表示される領域の位置を規定するための座標である。
このリンク情報は、画像ファイルのヘッダー部分に書き込むようにしてもよいし、音声データファイルのヘッダーとして一つのファイルとして記録するようにしてもよいし、画像ファイルや音声データファイルとは別のファイルとして記録するようにしてもよい。
本実施例では、図3(A)に示すように、「音声データファイル名」、「拡大倍率」、「拡大表示領域の開始座標」および「拡大表示領域の終了座標」からなるリンク情報が生成され、このリンク情報は図3(B)に示すように画像ファイルのヘッダー部分に記録される。
図2における操作部213は、表示部205で表示される画像を切り替えるための画像切替ボタン、画像生成装置101の電源のオン/オフを切り替えるための電源ボタン、後述するように、表示部205に表示された画像を拡大させるための画像拡大ボタン、画像全体の領域のうち拡大表示された領域を移動させるための移動ボタンを含む。
これらのボタンの操作による出力信号は制御部204に入力され、制御部204は入力された信号に応じた動作を行う。
図4には、画像生成装置101のうち表示部205を含む一部の領域を示している。ここで、液晶パネル401には、画像データ「Image001.jpg」(図3(B))における画像(レージングカーを表す画像)が表示されている。
同図において、表示部205における表示用液晶パネル401は、画像や操作メニューが表示される。音声録音ボタン(操作部213の一部)402は、音(主に、音声)を入力するために操作される操作ボタンであり、このボタンを押し込むことで録音状態となり、マイクロフォン403に音声を入力することで録音することができる。
画像拡大ボタン(操作部213の一部)404は、液晶パネル401に表示されている画像を拡大するために操作される操作ボタンであり、このボタンを押すたびに画像の拡大率が変化するようになっている。また、ボタン404を所定時間押し続けると、拡大再生が解除されて通常の表示状態(画像全体の領域が表示された状態)に戻る。
水平移動ボタン(操作部213の一部)405は、画像を拡大再生しているときに拡大表示領域を画像全体の領域に対して水平方向(図4の左右方向)に移動させるためのボタンである。垂直移動ボタン(操作部213の一部)406は、画像を拡大再生しているときに拡大表示領域を画像全体の領域に対して垂直方向(図4の上下方向)に移動させるためのボタンである。なお、十字ボタンを設けて、拡大表示領域を画像全体の領域に対して上下左右方向に移動させることもできる。
図4(A)には、画像を拡大せずに画像全体を液晶パネル401に表示している状態を示す。ここで、音声録音ボタン402を押し込んだ状態で、マイクロフォン403にむかって音声「レーシングカー」を入力すると、この音声が音声データとして記録される。
この時、同時に生成されるリンク情報A(図3参照)には、「音声データファイル名」として「Sound00.wav」が格納され、「拡大倍率」には「1倍」が格納される。
図4(B)には、図4(A)の状態から画像拡大ボタン404を押下して、画像を「T1倍」に拡大表示した状態を示す。ここで、図4(A)に示す状態で画像拡大ボタン404を操作すると、図4(A)に示す全体画像の中で中央に位置する領域が拡大されて表示されることになる。
そして、水平移動ボタン405や垂直移動ボタン406を操作すると、全体画像の中における拡大表示領域を移動させることができる。すなわち、画像拡大ボタン404と、移動ボタン405、406を操作することによって、全体画像の中における任意の領域を任意の倍率で液晶パネル401に表示させることができる。
図4(B)では、移動ボタン405、406を操作することによって、レーシングカーの先端側に位置する領域が拡大されて表示されている。ここで、音声録音ボタン402を押し込んだ状態で、マイクロフォン403に向かって音声「カーナンバー1番」を入力すると、この音声が音声データとして記録される。
この時、同時に生成されるリンク情報B(図3参照)には、「音声データファイル名」として「Sound01.wav」が格納され、「拡大倍率」には「T1倍」、「拡大表示領域の開始座標」には「(X1,Y1)」、「拡大表示領域の終了座標」には「(XX1,YY1)」が格納される。
図4(C)には、図4(B)の状態から移動ボタン405、406を操作することによって拡大表示領域を移動させた状態を示す。すなわち、同図では、図4(B)に示す領域に対して右側に位置する領域が、液晶パネル401に拡大表示されている。ここで、音声録音ボタン402を押し込んだ状態で、マイクロフォン403に向かって音声「側面のカーナンバー1番」を入力すると、この音声が音声データとして記録される。
この時、同時に生成されるリンク情報Cには、「音声データファイル名」として「Sound02.wav」が格納され、「拡大倍率」には「T1倍」、「拡大表示領域の開始座標」には「(X2,Y2)」、「拡大表示領域の終了座標」には「(XX2,YY2)」が格納される。
図4(D)には、図4(C)の状態から移動ボタン405、406を操作することによって表示領域を移動させるとともに、画像拡大ボタン404を操作することによって表示倍率を「T2倍(>T1倍)」に変更した状態を示している。この状態では、レーシングカーの前輪を含む領域が、T2倍で拡大されて液晶パネル401に表示されている。
ここで、音声録音ボタン402を押し込んだ状態で、マイクロフォン403に向かって音声「右側の前輪」を発すると、この音声が音声データとして記録される。
この時、同時に生成されるリンク情報D(図3参照)には、「音声データファイル名」として「Sound03.wav」が格納され、「拡大倍率」には「T2倍」、「拡大表示領域の開始座標」には「(X3Y3)」、「拡大表示領域の終了座標」には「(XX3,YY3)」が格納される。
図4(A)〜(D)で説明した一連の動作で生成される音声データは、それぞれ別々の音声データとして記録してもよいし、一つの音声データとして記録してもよい。なお、本実施例では、図3(B)に示すように画像データ「Image001.jpg」に関連づけられる音声データ「Sound00.wav」 〜 「Sound03.wav」が別々に記録されるようになっている。
図5は、本実施例の画像生成装置101における画像再生動作および音声録音動作を示すフローチャートである。
図5のフローチャートにおいて、ステップS501では、画像生成装置101に設けられた図示しない操作ボタンの操作により画像再生動作が開始される。
ステップS502において、制御部204は、メモリカードI/F209を介してメモリカード212に記録された画像ファイルを読み出し、一旦メモリ部207に格納する。
ステップS503では、画像処理部202によって、メモリ部207に格納された画像ファイルから画像データを生成し、表示部205で表示(再生)させる。
ステップS504において、制御部204は、操作部213のうち画像拡大ボタン402や移動ボタン404、405からの入力があるか否かを判別する。ここで、画像拡大ボタン402および移動ボタン404、405のうちいずれかのボタンが操作されると、ステップS503に戻り、操作されたボタンに応じた表示を行う。
すなわち、画像拡大ボタン402が操作されていれば画像の拡大表示を行い、移動ボタン404、405が操作されていれば画像の拡大領域を移動させて表示を行う。
一方、画像拡大ボタン402および移動ボタン404、405のいずれのボタンも操作されていなければ、ステップS505に進む。
ステップS505において、制御部204は、操作部213のうち音声録音ボタン402からの入力があるか否かを判別する。ここで、音声録音ボタン402が操作されていればステップS506に進み、操作されていなければステップS509に進む。
ステップS506において、制御部204は、音声録音ボタン402が押下されている間に音声データ生成部203(マイクロフォン403)に入力された音声を音声データとして生成し、メモリ部207へ記録させる。その後、音声録音ボタン402が放されると、音声データの作成を中止してステップS507に進む。
ステップS507では、ステップS506で生成された音声データと、音声入力時に表示部205に表示されている画像(拡大表示されていない画像又は拡大表示されている画像)とを関連づけるリンク情報を生成する。
その後、ステップS506で生成された音声データを、音声入力時の画像に対応させた音声データファイルとしてメモリカードI/F209を介してメモリカード212へ書き込む。また、ステップS507で生成されたリンク情報を画像ファイルのヘッダーに追加して、この画像ファイルをメモリカードI/F209を介してメモリカード212へ書き込む。
ステップS508では、音声録音ボタン402からの再度の入力があるか否かを判別する。ここで、音声録音ボタン402からの入力がある場合には、ステップS504に戻り、画像拡大ボタン402および移動ボタン404、405からの入力があるか否かを判別する。一方、音声録音ボタン402からの入力がない場合にはステップS509に進む。
ステップS509において、制御部204は、操作部213のうち上述した画像切替ボタンからの入力があるか否かを判別する。ここで、画像切替ボタンからの入力がある場合にはステップS502に戻り、画像切替ボタンによって選択された画像データをメモリカード212から読み出して表示部205で表示させる。
一方、画像切替ボタンからの入力がない場合には、ステップS510に進んで画像再生動作を終了する。
次に、画像/音声再生装置102について説明する。図6は、本実施例における画像/音声再生装置102の主要な機能構成を説明するブロック図である。
同図において、制御部603は、プログラム記憶部605に予め格納されているプログラムに従って画像/音声再生装置102における全体の動作を制御する。
画像/音声再生装置102に着脱可能に装着されたメモリカード612には、上述した画像生成装置101によって生成された画像ファイル(図3)が記録されている。
制御部603は、メモリカードI/F609を介してメモリカード612に記録された画像ファイルを読み出して、一旦メモリ部607に格納する。また、画像生成装置101から画像/音声再生装置102に画像ファイルが送信される場合には、シリアルバス611およびシリアルI/F608を介して画像ファイルを受信し、この画像ファイルをメモリ部607に格納する。
メモリ部607に格納された画像ファイルの画像データは、画像処理部601にて伸張処理やリサイズ処理などが施されてから表示部604に出力されて表示される。なお、画像/音声再生装置102では、画像拡大ボタンや移動ボタン(操作部613の一部)を操作することによって、表示部604に表示された画像を拡大表示させたり、この拡大表示された領域を移動させたりすることができる。
制御部603は、メモリ部607に格納された画像ファイルのヘッダー部分を解析し、ヘッダー部分にリンク情報が格納されているときには、メモリカードI/F609を介してメモリカード612から音声データファイルを読み出して、メモリ部607に格納する。ここで、リンク情報はリンク情報処理部606へ送られる。
リンク情報処理部606は、リンク情報の解析を行うことによってリンク情報に含まれている「拡大倍率」、「拡大表示領域の開始座標」、「拡大表示領域の終了座標」の情報から全体画像のうち音声データが関連づけられている画像領域を求め、この画像領域を表示部604に表示されている画像にオーバーラップして表示する。
音声データ再生部602は、音声データをD/A変換して出力するD/A変換器と、D/A変換器からの出力を受けて音を発するスピーカとを有する。ここで、音声データの再生が指示されると、メモリ部607に格納されている音声データが音声データ再生部602に入力され、音声データ再生部602にて音声データに応じた音声を再生(発音)させることができる。
図7は、表示部604に、メモリカード612に記録された画像を表示させた状態を示している。ここで、図7(A)では、表示部604に画像全体が表示されており、この表示画像内には、音声データが関連づけられている画像領域を示す枠701〜703が表示されている。全体画像中における枠701〜703の位置および大きさは、画像ファイル内に含まれるリンク情報に基づいて、上述したようにリンク情報処理部606にて演算される。
表示部604の表示面のうち画像が表示された領域の下側には画像ファイル名(図7では、「Image001.jpg」)705が表示されており、また、画像表示領域の右側には、画像全体の領域に対して関連づけられた音声データがあることを示す音符マーク706が表示されている。
図7(A)に示す状態において、画像/音声再生装置102に設けられた不図示の操作部材(操作部613の一部)を操作することによって枠701を選択(具体的には、枠701内の領域を選択)して音声の再生を指示すると、「Sound01.wav」の音声データが音声データ再生部602へ入力され、音声データ再生部602のスピーカーから「カーナンバー1番」の音声が再生される。同時に、図7(B)に示すように、表示部604には枠701内の画像領域が自動的に拡大再生される。
同様に、枠702を選択して音声の再生を指示すると、「Sound02.wav」の音声データが音声データ再生部602へ入力され、スピーカーから「側面のカーナンバー1番」の音声が再生されるとともに、表示部604には枠702内の画像領域が自動的に拡大再生される。
枠703を選択して音声の再生を指示すると、「Sound03.wav」の音声データが音声データ再生部602へ入力され、スピーカーから「右の前輪」の音声が再生されるとともに、表示部604には枠703内の画像領域が自動的に拡大再生される。
枠701〜703が選択されていない状態で音声の再生を指示すると、「Sound00.wav」の音声データが音声データ再生部602へ入力され、スピーカーから「レーシングカー」の音声が再生される。
ここで、枠701〜703を選択するために操作される上記の操作部材(操作部613の一部)は、ボタン式やダイアル式の構成とすることができる。また、マウスのようなポインティングデバイスを用いることもできる。
図7(C)には、図7(A)に示す表示画像の一部を拡大表示させたときの状態を示す。ここで、画像/音声再生装置102に設けられた不図示の画像拡大ボタン(操作部613の一部)を操作することで画像の一部を拡大させて表示させることができる。また、画像/音声再生装置102に設けられた不図示の移動ボタン(操作部613の一部)を操作することによって、拡大表示されている画像を表示部604の表示面における横方向および縦方向に移動させることができる。
すなわち、図7(C)に示す表示画像は、上記の画像拡大ボタンおよび移動ボタンを操作することによって、図7(A)に示す表示画像のうち画面右上における領域を拡大したものである。
ここで、画像全体の一部を拡大表示したときに、この拡大表示領域内に音声データが関連づけられた画像領域が存在する場合には、この領域の外周を表す枠が表示されることになる。図7(C)では、枠702の一部が表示されている。
すなわち、リンク情報処理部606は、表示部604に拡大表示される画像領域と、リンク情報の「拡大倍率」、「拡大表示領域の開始座標」、「拡大表示領域の終了座標」の情報に基づいて、拡大表示される画像領域内における音声データが関連づけられている画像領域の位置および大きさを演算し、この画像領域の外周を表す枠を拡大画像にオーバーラップさせて表示させる。
図8は、本実施例の画像/音声再生装置における画像再生動作および音声再生動作を示すフローチャートである。
図8のフローチャートにおいて、ステップS801では、画像/音声再生装置102に設けられた不図示の操作ボタン(操作部613の一部)が操作されることによって画像再生動作が開始される。
ステップS802において、制御部603は、メモリカードI/F609を介してメモリカード612に記録された画像ファイルを読み出し、一旦メモリ部607に格納する。
ステップS803において、制御部603は、メモリ部607に格納された画像ファイルに、音声データが関連付けられているかどうかを判別する。この判別は、図3(B)に示す画像ファイルのヘッダー部にリンク情報が格納されているか否かを検出することによって行う。
ここで、リンク情報が格納されていることを検出した場合には、制御部603は、メモリカードI/F609を介してメモリカード612から音声データファイルを読み出し、メモリ部607に格納する。そして、ステップS804に進む。一方、リンク情報が格納されていないことを検出した場合には、ステップS811に進む。
ステップS804では、画像ファイルのヘッダー部に格納されたリンク情報の解析をリンク情報処理部606で行う。リンク情報処理部606は、リンク情報に書き込まれている「拡大倍率」、「拡大表示領域の開始座標」、「拡大表示領域の終了座標」に基づいて、音声データが関連付けられている領域が表示部604に表示される画像のうちどの領域に相当するかを演算する。
ここで、リンク情報が複数格納されているときは、全てのリンク情報に対して上記の演算を行い、音声データが関連付けられているすべての領域を求める。
ステップS805では、画像処理部601にて画像ファイル内の画像データに対して伸張処理等が施された後、表示部604にて画像全体が表示される。ここで、表示部604に表示される画像には、ステップS804で求められた音声データが関連付けられている領域(枠)がオーバーラップして表示される。
一方、ステップS803でリンク情報を格納されていないことを検出してステップS811に進んだ場合には、画像処理部601にて画像処理が施された画像データが表示部604に表示される。このとき、画像ファイルにはリンク情報(音声データ)が格納されていないため、上記の枠は表示されない。
ステップS806において、制御部603は、上記の枠(音声データが関連づけられた領域)を選択するための操作部材(操作部613の一部)からの入力があるか否かを判別する。ここで、上記の操作部材からの入力がある場合には、入力に応じた枠内の領域を選択してステップS807に進む。図7(A)に示す場合には、枠701〜703と画像全体に対応した音声データが存在することを表す音符マーク706を選択することができる。ここで、枠701〜703のうちいずれか2つ以上を選択することもできるし、枠701〜703のうちいずれかの枠と音符マーク706を同時に選択することもできる。
一方、枠を選択するための操作部材からの入力がない場合には、ステップ809に進む。
ステップS807において、制御部603は、画像/音声再生装置102に設けられた音声データ再生用の操作部材(操作部613の一部)からの入力があるか否かを判別する。ここで、音声データ再生用の操作部材が操作されている場合には、ステップS808に進み、操作されていなければステップS809に進む。
ステップS808では、ステップS806で選択された画像領域に対応した音声ファイルが音声データ再生部602へ送られる。音声データ再生部602においては、音声データに所定の信号処理を施してスピーカーから音声を出力する。同時に制御部604は、ステップS806で選択された枠内の画像領域を画像処理部601を介して拡大させて表示部604に表示させる。
ここで、ステップS806で複数の画像領域を選択している場合には、選択されている各画像領域に対応した音声データが順次、音声データ再生部602により再生される。また、音声データの再生と同時に、この音声データに対応した画像領域を表示部604で拡大表示させる。この音声データおよび画像領域の切り換えは、所定時間を経過するたびに行われる。
音声データを再生する順番は、音声データが生成された順番(データ生成日時の最新のものから順に、又は古いものから順に表示)としたり、枠が選択された順番(最初に選択された枠→最後に選択された枠、又は最後に選択された枠→最初に選択された枠の順番)としたりすることができる。または、音声データの録音時間の長さの順番(録音時間が長い側→短い側、又は録音時間が短い側→長い側の順番)とすることもできるし、音声領域の拡大率の順番(拡大率が大→小又は小→大の順番)や座標の順番(表示画面の一端側→他端側の順番)とすることもできる。
また、上述した複数の順番のうちいずれかの順番を使用者が画像/音声表示装置102において自由に設定することができるようにしてもよい。これにより、使用者の好みに応じて音声データを順次再生することができる。
そして、音声データの再生(これに伴う画像領域の拡大表示)が終了すると、音声データ再生前の画像が再び表示部604に表示され、ステップS809に進む。
ステップS809において、制御部603は、画像/音声再生装置102に設けられた画像拡大ボタンおよび移動ボタン(操作部613の一部)の操作によって、表示部604に表示された画像の一部を拡大表示させる指示があるか否かを判別したり、画像の一部を拡大表示している場合には拡大表示領域を移動させる指示があるか否かを判別したりする。
ここで、拡大表示の指示や、拡大表示領域を移動させる指示がある場合には、ステップS803に戻り、上述した動作を繰り返す。このとき、表示部604に表示される画像領域が変更されるため、リンク情報に書き込まれている、「拡大倍率」、「拡大表示領域の開始座標」、「拡大表示領域の終了座標」に基づいて、音声データが関連付けられている領域が表示部604に表示された画像領域のどの領域に対応するかを再度演算される。そして、この演算結果に基づいて画像領域を示す枠をオーバーラップして表示させる。
一方、拡大表示の指示や、拡大表示領域を移動させる指示がない場合には、ステップS810に進む。
ステップS810において、制御部603は、画像/音声再生装置102に設けられた画像切替ボタンの操作によって他の画像データが選択されたか否かを判別する。ここで、他の画像データが選択された場合にはステップS802に戻り、メモリカード612から選択された画像ファイルを読み出して、画像の再生表示を行う。一方、他の画像データが選択されていない場合にはステップS812に進んで、画像再生動作を終了する。
なお、本発明の構成は、上述した実施例に限定されるものではなく、画像生成装置および画像再生装置の仕様や想定ユーザー層などによって様々な実施例が考えられる。
実施例1における画像生成装置および画像/音声再生装置の説明図。 上記の画像生成装置の構成を示すブロック図。 リンク情報および画像ファイルの構成を説明する図。 音声データ生成時の説明図。 上記の画像生成装置における画像再生動作および録音動作を示すフローチャート。 上記の画像/音声再生装置の構成を示すブロック図。 画像/音声再生装置における画像再生時のモニターの表示例。 上記の画像/音声再生装置における再生動作を示すフローチャート。
符号の説明
101 画像生成装置
102 画像/音声再生装置
201 撮像部
202 現像処理部
203 音声データ生成部
204 制御部
205 表示部
206 プログラム記憶部
207 メモリ部
208 シリアルインターフェース
209 メモリカードインターフェース
210 データバス
211 シリアルバス
212 メモリカード
401 表示用液晶パネル
402 音声録音ボタン
403 マイクロフォン
404 画像拡大ボタン
405 水平方向移動ボタン
406 垂直方向移動ボタン
601 現像処理部
602 音声データ生成部
603 制御部
604 表示部
605 プログラム記憶部
606 リンク情報処理部
607 メモリ部
608 シリアルインターフェース
609 メモリカードインターフェース
610 データバス
611 シリアルバス
612 メモリカード



Claims (7)

  1. 画像データを表示させる表示手段と、
    前記表示手段により表示された画像データのうち一部の画像領域を拡大して表示させる拡大手段と、
    前記一部の画像領域を拡大して表示しているときに、音声入力の指示があると入力された音声データと、前記一部の画像領域とを関連付けるリンク情報を生成するリンク手段とを有することを特徴とする情報処理装置。
  2. 前記一部の画像領域の位置または大きさを変更する変更手段を有することを特徴とする請求項記載の情報処理装置。
  3. 前記リンク情報は、前記一部の画像領域の座標情報を含むことを特徴とする請求項記載の情報処理装置。
  4. 前記リンク情報は、前記一部の画像領域の拡大率を示す情報を含むことを特徴とする請求項記載の情報処理装置。
  5. 画像データを表示するステップと、
    前記表示された画像データのうち一部の画像領域を拡大して表示させるステップと、
    前記一部の画像領域を拡大して表示しているときに、音声入力の指示があると入力された音声データと、前記一部の画像領域とを関連づけるリンク情報を生成するステップとをコンピュータに実行させることを特徴とするプログラム。
  6. 画像データを表示させるとともに、この表示された画像データのうち一部の画像領域に関連づけられた音声データを出力させる情報処理装置であって、
    複数の前記一部の画像領域をそれぞれ識別可能な状態で前記画像データと共に表示させる表示手段と、
    前記一部の表示領域を複数選択する選択手段と、
    前記選択手段により選択された前記複数の前記一部の画像領域に関連づけられた音声データをそれぞれ出力させるとともに、前記一部の画像領域を拡大して表示させる制御手段とを有し、
    前記制御手段は、前記音声データの録音時間の長さに応じて、前記選択手段により選択された前記複数の前記一部の画像領域に関連づけられた音声データの再生順番を決定することを特徴とする情報処理装置。
  7. 前記制御手段は、前記音声データを出力している間、前記出力している音声データ各々に対応する前記一部の画像領域を拡大して表示させることを特徴とする請求項に記載の情報処理装置。
JP2003329169A 2003-09-19 2003-09-19 情報処理装置およびプログラム Expired - Fee Related JP4347007B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003329169A JP4347007B2 (ja) 2003-09-19 2003-09-19 情報処理装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003329169A JP4347007B2 (ja) 2003-09-19 2003-09-19 情報処理装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2005094711A JP2005094711A (ja) 2005-04-07
JP4347007B2 true JP4347007B2 (ja) 2009-10-21

Family

ID=34458489

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003329169A Expired - Fee Related JP4347007B2 (ja) 2003-09-19 2003-09-19 情報処理装置およびプログラム

Country Status (1)

Country Link
JP (1) JP4347007B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5982884B2 (ja) * 2012-03-08 2016-08-31 ソニー株式会社 表示制御装置、表示制御方法およびコンピュータ読み取り可能な記録媒体
JP6218696B2 (ja) 2014-07-31 2017-10-25 キヤノン株式会社 画像表示装置、画像表示方法、およびプログラム

Also Published As

Publication number Publication date
JP2005094711A (ja) 2005-04-07

Similar Documents

Publication Publication Date Title
JP2004120544A (ja) 画像編集装置、画像編集プログラム並びに画像編集方法
JP2008060731A (ja) カメラ、出力画像選択方法、プログラム
JP2012015830A (ja) カメラ
JP2005347886A (ja) 映像記録装置
US7136102B2 (en) Digital still camera and method of controlling operation of same
JP3790871B2 (ja) 画像再生装置
JP5463973B2 (ja) 表示制御装置、表示制御プログラム、および表示制御システム
JP4665793B2 (ja) 動画像ファイル生成プログラムおよび電子カメラ
JP4347007B2 (ja) 情報処理装置およびプログラム
JP2010258917A (ja) 撮影装置、プログラム、及び撮影方法
JP4066794B2 (ja) 画像データ記憶方法、画像データ記憶・再生方法及び撮像装置
JP4761544B2 (ja) 再生装置及びその制御方法
JP4403332B2 (ja) 画像記録装置及び画像記録方法
JP2005143014A (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP2007266676A (ja) 撮像装置、撮影画像の表示方法、撮影画像の表示プログラム、撮影画像の削除方法及び撮影画像の削除プログラム
JP4783073B2 (ja) カメラ及びこのカメラの表示制御装置とその表示制御方法
JP6166070B2 (ja) 再生装置および再生方法
JP2017112455A (ja) 情報処理装置
JP2007306246A (ja) 記録装置
JP4401711B2 (ja) 画像処理装置及び画像処理方法
JP5948927B2 (ja) 画像処理装置と画像処理方法とプログラムおよび撮像装置
JP2009303122A (ja) 撮像装置及び撮像制御方法
JP5057135B2 (ja) 再生装置および再生方法、記録装置および記録方法、並びにプログラム
JP2005175597A (ja) 電子カメラ
JP2005197822A (ja) 撮像装置およびタイトル付サムネイル画像の生成方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060913

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20081010

RD05 Notification of revocation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7425

Effective date: 20081201

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090120

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090323

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090428

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090624

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090714

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090715

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120724

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120724

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130724

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees