JP5754967B2 - 画像情報処理装置及びその制御方法 - Google Patents

画像情報処理装置及びその制御方法 Download PDF

Info

Publication number
JP5754967B2
JP5754967B2 JP2011026525A JP2011026525A JP5754967B2 JP 5754967 B2 JP5754967 B2 JP 5754967B2 JP 2011026525 A JP2011026525 A JP 2011026525A JP 2011026525 A JP2011026525 A JP 2011026525A JP 5754967 B2 JP5754967 B2 JP 5754967B2
Authority
JP
Japan
Prior art keywords
sound
image
outer peripheral
data associated
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011026525A
Other languages
English (en)
Other versions
JP2012169704A5 (ja
JP2012169704A (ja
Inventor
俊則 山本
俊則 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2011026525A priority Critical patent/JP5754967B2/ja
Priority to US13/361,410 priority patent/US20120201404A1/en
Publication of JP2012169704A publication Critical patent/JP2012169704A/ja
Publication of JP2012169704A5 publication Critical patent/JP2012169704A5/ja
Application granted granted Critical
Publication of JP5754967B2 publication Critical patent/JP5754967B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/13Aspects of volume control, not necessarily automatic, in stereophonic sound systems

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)
  • Instructional Devices (AREA)
  • Navigation (AREA)
  • Television Signal Processing For Recording (AREA)

Description

本発明は、座標データが関連付けられた画像に関連付けられた音声データを出力する画像情報処理装置及びその制御方法に関する。
複数の音声付画像を一つの表示画面上へ出力する代表的な装置として、テレビ会議システムがある。テレビ会議システムでは、複数の送信元から送信された画像が合成され、一つの表示画面上へ画面分割して表示される。この場合の音声は、複数の送信元から送られた画像に付随する音声を単に合成して再生する処理方法をとると、聞き手にとって聞いている声がどの送信元の声であるか、すなわち複数の会議参加者のうち誰の声を聞いているかが判別しにくいものとなる。
例えば特許文献1では、送信元毎に表示画面上の表示位置と音声データを関連付けることにより、画面上における当該送信元画像の表示位置に対応した方向のスピーカから対応する送信元の音声出力を可能にし、この問題に対処している。
一方、近年、地図データと静止画や動画を一つの表示画面上へ関連付け表示させるアプリケーションが注目されている。例えば特許文献2は、撮影装置が画像撮影と同時に座標データを取得し撮影画像ファイルと関連付けて記録媒体へ保存し、再生表示装置が記録媒体中の座標データを参照し、撮影画像の位置を地図中へ表示する構成を開示している。
特開平8−125760号公報 特開2000−065588号公報
撮影場所などの位置情報に基づいて地図上に画像をマッピングするような表示方法に特許文献1のような技術を適用し、表示位置に対応した音声を出力させる場合を考える。この場合、表示画面内の地図上に存在する、音声が付随する画像の数が少数であれば、再生された音声がどの画像についてのものかの判別は容易である。しかし、表示画面内に存在する、音声が付随する画像の数が多数になると、いっせいに複数の音声が再生され、それらの音声がそれぞれどの画像についての説明なのか判別が困難になるという問題がある。
他方、このアプリケーションには、画像データの検索性に優れるという長所がある。つまり、画像データを地図データと関連付けることによりユーザは自ら撮影した記憶を引き出すことが容易になるので、画像の捜索が簡単になる。すなわち、このアプリケーションは、単純に地図と画像データを同時に見るという使い方より、目的の画像を検索する使い方のほうが重視される。
そこで、本発明は、地図上の座標位置にマッピングされた画像の検索性を向上させるために、画像に関連付けられた音声の新たな出力手法を提供する。
本発明の一側面によれば、複数チャンネルに分けて音声を出力する出力手段と、地図を表示するとともに、座標データ及び音声データが関連付けられた音声付画像を、該座標データが示す前記地図の座標位置にマッピングして表示する表示手段と、前記表示手段により現在表示されている音声付画像に関連付けられた音声データに対応する音声について、該音声付画像に関連付けられた座標データが示す位置に応じて前記出力手段の各チャンネルから出力される音量を制御する第1の制御手段と、前記地図の表示範囲を変更する操作がされている場合、前記表示手段により現在表示されている音声付画像に関連付けられた音声データに対応する音声については消音し、現在表示されていない音声付画像であって、座標データが現在の表示範囲の所定の外周領域における位置を示す音声付画像に関連付けられた音声データに対応する音声について、当該位置に応じて前記出力手段の各チャンネルから出力される音量を制御する第2の制御手段とを有することを特徴とする画像情報処理装置が提供される。
本発明によれば、地図の表示範囲を変更する操作がされている場合には現在表示されている音声付画像の音声が消音され、現在の表示範囲外の所定の外周領域に位置する音声付画像の音声が、その位置に応じた音量で出力される。これにより、ユーザは現在の表示範囲に含まれる音声付画像の音声に惑わされることなく、表示範囲外の音声付画像の音声を頼りに目的の画像を容易に探すことができる。
画像情報処理装置のブロック図。 (a)は、通常モードにおける、表示画面内及び表示画面外周領域に存在する音声付画像及び地図データの模式図、(b)は、検索モードにおける、表示画面内及び表示画面外周領域に存在する音声付画像及び地図データの模式図。 (a)は、通常モードにおける、画像に付随する音声の音像定位及び音量の制御方法の模式図、(b)は、検索モードにおける、画像に付随する音声の音像定位及び音量の制御方法の模式図。 音声出力部において構成される音声合成回路の例を示す図。 音声付画像の音声の音像定位制御方法を示す流れ図。 図2のように音声付画像が配置された場合の合成音量比を表す図。 画像情報処理装置の動作モード切り換えの制御手順を示す流れ図。 画像情報処理装置の通常モードでの音声出力方法を示す流れ図。 画像情報処理装置の検索モードでの音声出力方法を示す流れ図。 検索モードにおける表示画面及び表示画面外周領域の音声付画像及び地図データの状態を表す図であり、(a)タイミングTでの状態、(b)はタイミングT+1での状態を表す図。
以下、図面を参照して本発明の実施形態を説明する。
以下の実施形態では、検索モードにおいては表示画面内の座標に関連付けられている音声データを消音し、表示画面外の特定領域の座標に関連付けられているN個の音声データのみを発音するよう制御する例を述べる。さらに、音声データに関連付けられた座標値と表示画面の座標の相対位置関係に応じ、出力音声チャンネル及び出力音量を制御する例を述べる。
図1は本実施形態に係る画像情報処理装置のブロック図である。110は表示画面の座標を記憶する座標記憶部である。なお、座標記憶部110は後述するRAM200で代用してもよい。120は、地図データを記憶する他、画像データ及びそれに関連付けられた座標及び音声データを記憶するソースデータ記憶部である。130はユーザの操作を受け付けるマウスやタッチパネル等の操作部である。150は圧縮された画像データ及び音声データを伸張するデータ伸張部である。CPU160は各種プログラムを実行して画像情報処理装置の各ブロックを制御する。画像表示部170は、CPU160からの表示制御に基づいて画像データの表示等、各種表示を行うLCDなどの表示モニタである。180は音声データをDA変換し、増幅し、可聴信号として出力する音声出力部である。181−184は、複数チャンネルに分けて音声を出力する出力手段としての、互いに離間して配置された複数チャンネルのスピーカであり、本実施形態では4チャンネルのスピーカである。具体的には、181はフロント左スピーカ(SP FL)、182はリア左スピーカ(SP RL)、183はリア右スピーカ(SP RR)、184はフロント右スピーカ(SP FR)である。ROM190には、各種プログラムや、画像情報処理装置の動作に必要な各種データが記録されている。RAM200はCPU160がROM190に記録されたプログラムを実行する際にワークメモリとして使用されるメモリである。後述する各種フローチャートは、CPU160がROM190に記録されたプログラムをRAM200に展開して実行することで実現される。
次に、図2を用いて、本実施形態の画像情報処理装置における2つの動作モードについて説明する。本実施形態における画像情報処理装置は、地図を表示するとともに、座標データ及び音声データが関連付けられた画像(以下「音声付画像」という。)を、その座標データが示す地図の座標位置にマッピングして表示する表示モードを有する。そして、その表示モードには、少なくとも「通常モード」と「検索モード」がある。「通常モード」は、表示画面内の座標中に存在する音声付画像を、背景の画像と共に表示する動作モードである。「検索モード」は、主に表示画面の外周領域の座標中に存在する(表示画面近傍の)音声付画像を検索する動作モードである。
図2(a)は、通常モードにおける、表示画面内及び表示画面外周領域に存在する音声付画像及び地図データを図示したものである。図2(b)は、検索モードにおける、表示画面内及び表示画面外周領域に存在する音声付画像及び地図データを図示したものである。図2において、実線で示される四角枠10は画像表示部170の表示画面の外郭を示し、破線で示される四角枠20は表示画面外周領域の外郭を示す。また、符号Index−1、Index−2、Index−3、Index−4はその座標位置に存在する音声付画像を示す。
ここで、図2(a)に示す通常モードでは、表示画面内の音声付画像Index−1、Index−2については、画像(動画又は静止画)が表示されるとともにその画像に付随する音声が発音される。また、表示画面外の音声付画像Index−3、Index−4については、画像が表示されないのはもちろん、その画像に付随する音声も発音されない。
一方、検索モードにおいては、ユーザは、現在の表示範囲に含まれている画像ではなく、現在の表示範囲に含まれていない周囲の何らかの画像を探していると考えられる。そうすると、そのような場合に現在の表示範囲内の音声付画像の音声を出力しても、それはユーザにとってはノイズでしかない。そこで、検索モードにおいては、現在の表示範囲に含まれる音声付画像の音声は発音せず、表示範囲外にある1つ以上の音声付画像の音声のみを出力する。例えば、図2(b)に示す検索モードの例においては、表示画面内の音声付画像Index−1、Index−2については、画像は表示されるが、その画像に付随する音声は消音される。一方、表示画面外の音声付画像Index−3、Index−4については、画像は表示されないが、その画像に付随する音声は発音される。
次に、図3を用いて2つの動作モードにおける音声制御について更に詳細に説明する。図3は、音声付画像の座標位置に応じた、当該画像に付随する音声の音像定位及び音量の制御方法を説明する図であり、(a)は通常モードの制御、(b)は検索モードでの制御を示している。
図3(a)に示すように、通常モードでは、表示画面内の音声付画像については画像に付随する音声が発音され、更に、音声付画像に関連付けられた座標位置に応じた音像定位及び音量の第1の制御が行われる。多くの地図表示アプリケーションにおいては、通常時は、ユーザの現在位置あるいはユーザが着目する位置を表示画面の中心に据えることが多いであろう。そこで、本実施形態の通常モードでは、音声付画像に関連付けられた座標位置が表示画面の中心に近いほど音量を大きく制御し、音声付画像に関連付けられた座標位置が表示画面の中心から遠いほど音量を小さく制御し、表示画面外の座標位置の場合は消音する。あわせて、表示画面中に配置される各音声付画像に関連付けられた座標位置に応じ、各画像に付随する音声の音像定位制御を行う。すなわち、現在表示されている音声付画像に関連付けられた音声データに対応する音声については、その音声付画像に関連付けられた座標データが示す位置に応じて各チャンネルのスピーカから出力される音量を制御する。
一方、図3(b)に示すように、地図の表示範囲を変更する操作がされている場合に動作する検索モードでは、表示画面外の音声付画像についてはその音声は発音されるが、表示画面内の音声付画像についてはその音声は消音される。また、表示画面外の音声付画像については、音声付画像に関連付けられた座標位置に応じた音像定位及び音量の第2の制御が行われる。つまり、音声付画像に関連付けられた座標位置が表示画面に近いほど音量を大きく制御し、音声付画像に関連付けられた座標位置が表示画面から遠いほど音量を小さく制御し、表示画面から更に遠い座標位置の場合は消音する。あわせて、各音声付画像に関連付けられた座標位置と表示画面座標の位置関係に応じ、各画像に付随する音声の音像定位制御を行う。すなわち、座標データが現在の表示範囲の所定の外周領域における位置を示す音声付画像に関連付けられた音声データに対応する音声について、当該位置に応じて各チャンネルのスピーカから出力される音量を制御する。
本実施形態では、図3(a)、(b)に示した関係がそれぞれ、例えば、座標値ごとにスピーカのチャンネル間の音量比を記述した音量比テーブルによって表されるものとする。各モードの音量比テーブルは例えばROM190に予め格納される。
以下、図3に示した音像定位及び音量の制御を実現するための構成及び制御手順を詳しく説明する。図4は、音声出力部180において構成される音声合成回路の例である。図4において、401、402、403、404はそれぞれ、図2(a)、(b)に示された音声付画像Index−1、Index−2、Index−3、Index−4の音声データ入力端子である。410、411、412、413は各音声の合成音量比設定回路であり、それぞれ、フロント左スピーカ、リア左スピーカ、リア右スピーカ、フロント右スピーカの各チャンネルに対応する。420、421、422、423はそれぞれ、前段の合成音量比設定回路の各出力を合成する合成回路である。430、431、432、433はそれぞれ、フロント左スピーカ、リア左スピーカ、リア右スピーカ、フロント右スピーカに対応する音声出力端子である。450は音像定位及び音量を設定する設定部である。なお、この設定部450の機能はCPU160によって実現されうる。
音声付画像の音声の音像定位及び音量の制御方法を図5を用いて説明する。図5のフローチャートに対応する制御プログラムは例えばROM190に格納され、RAM200にロードされCPU160によって実行される。
まず、CPU160は、表示画面の座標を座標記憶部110から読み出し、RAM200に格納する(S501)。次に、CPU160は、ソースデータ記憶部120より音声付画像の座標を読み出し、RAM200に格納する(S502)。その後、CPU160は、表示画面の座標に対する、音声付画像の座標の相対位置を算出する(S503)。次に、CPU160は、現在設定されている動作モード(通常モード/検索モード)に対応する音量比テーブルをROM190から読み出し、これを参照して、S503で算出した相対位置に対応する合成音量比を決定する(S504)。そして、設定部450は、S504で決定された合成音量比に従うゲインを、各合成音量比設定回路に対して設定する(S505)。音声付画像が複数ある場合は、全ての音声付画像について図5の制御処理を実施する。図6に、図2の如く4つの音声付画像が配置された場合における、音声付画像ごとのスピーカのチャンネル間の合成音量比の例を示す。(a)は通常モードの場合、(b)は検索モードの場合を示している。
図7は、2つの動作モード(通常モード/検索モード)の切り換えの制御手順を示している。CPU160は、操作部130からの指示をモニタしている(S701)。操作部130からの指示があった場合、その指示が検索モードの指定かどうかを判定する(S702)。例えば、ユーザが検索スイッチを押圧したり、検索のソフト表示スイッチをクリックしたような場合は、当然に、検索モードが指定されたと判定する。しかし、本発明ではさらに、例えば、ドラッグ操作、矢印キー操作、ズーム操作、パンニング操作、スクロール操作が検出された場合も、検索モードが指定されたと判定する。これらの操作はいずれも、画像表示部170上での表示範囲を変更する操作であるからである。S702で検索モードが指定されたと判定されなかった場合は、通常モードでシステムを操作させる(S703)。一方、S702で検索モードが指定されたと判定された場合は、検索モードでシステムを動作させる(S704)。
次に、通常モードでの音声付画像の音声出力方法について、図8を用いて説明する。まず、CPU160は、表示画面の座標を座標記憶部110から読み出し、RAM200に格納する(S801)。次に、CPU160は、ソースデータ記憶部120より表示画面内の座標を有する音声付画像の座標を読み出し、RAM200に格納する(S802)。次に、CPU160は、図5の流れ図に従い、表示画面内の座標を有する音声付画像に関連付けられた音声データに対応する音声について、音像定位及び音量の制御を行う(S803)。そしてCPU160は、表示画面内の座標を有する音声付画像の全てについて音像定位及び音量の制御が完了したかどうかを判断する(S804)。未完了であればS802へ戻って他の音声付画像についての処理を行う。全て完了したならばS805へ進む。S805では、CPU160は、個別に設定した音声付画像の音像定位及び音量により、表示画面内の全ての音声付画像の音声を合成出力する。なお、この合成出力処理において、CPU160は、ソースデータ記憶部120より該当する音声付画像の圧縮音声データを取り出し、これをデータ伸張部150が伸張する。その後、CPU160は、伸張された音声データを音声出力部180へ送り、合成させる。
次に、検索モードでの音声付画像の音声出力方法について、図9を用いて説明する。まず、CPU160は、表示画面の座標を座標記憶部110から読み出し、RAM200に格納する(S901)。CPU160は、ユーザによる検索操作により、直前のタイミングにおいて表示画面外の座標に関連付けられていた音声付画像が、現在のタイミングで表示画面内の座標へ移動していないかを検査する(S902)。表示画面内に移動した音声付画像がある場合は、その音声付画像に対して音像定位及び音量の制御を行う(S903)。なお、この制御の詳細については後述する。
次に、CPU160は、座標記憶部110から表示画面の外郭に隣接する第1の外周領域の座標を読み出し、この領域内の座標に関連付けられた音声付画像をソースデータ記憶部120から検索する(S904)。ここで該当する音声付画像が発見された場合は、図5の流れ図に従い音声付画像の音像定位及び音量の制御を行う(S905)。次に、CPU160は、これまでにS904で発見された音声付画像の数nを計数する(S906)。そしてCPU160は、ソースデータ記憶部120を参照し、第1の外周領域内の座標に関連付けられた音声付画像の全てについて音像定位及び音量の制御が完了したかどうかを確認する(S907)。未完了であればS904へ戻って他の音声付画像についての処理を行う。全て完了したならばS908へ進む。S908では、CPU160は、S906で計数した音声付画像の数nが、予め設定された所定数N以上であるかどうかを判断する。N未満であればS909へ、N以上であればS911へ進む。ステップS908の目的は、発音される音声付画像の数が多すぎる場合に、発音されている音声がユーザにとってノイズとなってしまうのを防ぐためである。したがって、Nの数は3程度が適切な値となろう。
S909では、CPU160は、全ての外周領域について処理が完了したかどうかを判断する。全ての外周領域の処理が済んでいない場合はS910に進む。全ての外周領域の処理が完了した場合はS911に進む。S910では、CPU160は、音声付画像を検索する座標を第1の外周領域の更に外周の第2の外周領域に移して、S904からの検索処理を繰り返す。S911では、CPU160は、以上の処理ステップで選択された音声付画像を「近傍画像」として、RAM200に記録する。これは後述するS903の、表示画面内に移動してきた音声付画像に対する音像定位及び音量の制御処理において使用されるものである。その後、CPU160は、個別に設定された音声付画像の音像定位及び音量により、選択された表示画面の外周領域の音声付画像の音声を合成出力する(S912)。なお、この合成出力処理において、CPU160は、ソースデータ記憶部120より該当する音声付画像の圧縮音声データを取り出し、これをデータ伸張部150が伸張する。その後、CPU160は、伸張された音声データを音声出力部180へ送り、合成させる。
上述の実施形態によれば、スクロール操作等により表示範囲を変更しようとする操作が行われている最中は、画像情報処理装置は検索モードに入る。前述したように、この状態においては、ユーザは、現在表示されている画像ではなく、現在の表示範囲に含まれていない周囲の何らかの画像を探していると考えられる。そうすると、そのような場合に現在の表示範囲内の音声付画像の音声を出力しても、それはユーザにとってはノイズでしかない。そこで、検索モードにおいては、現在の表示範囲に含まれる音声付画像の音声は発音せず、表示範囲外にある1つ以上の音声付画像の音声のみを、それらの座標に応じて合成出力する。こうすることで、ユーザは現在の表示範囲に含まれる音声付画像の音声に惑わされることなく、表示範囲外の音声付画像の音声を頼りに目的の画像を探すことができる。具体的には、ユーザは、目的とする画像の音の鳴っている方へスクロール操作をすればよい。
また、上述の実施形態によれば、検索モードにおいて、外周領域の探索は、選択された音声付画像の数が所定数以上になったところで打ち切られる。これにより、発音される音声付画像の数が多すぎてそれがユーザにとってノイズとなってしまうのを防ぐことができ、ユーザは効率よく音声を頼りに目的の場所を見つけることができる。
また、上述のとおり、検索モードにおいては、外周領域の探索は、選択された音声付画像の数が所定数N以上になったところで打ち切られる。これにより、検索モードにおいて発音される音声付画像を探索する座標エリアが限定されるので、探索処理にかかる時間を短くすることが可能になる。また、必要以上に遠くの音声付画像の音がユーザにとってノイズになってしまうのを防ぐことができる。なお、S904であまりに多数の音声付画像が検索されてしまった場合にはやはりそれが同時に発音されるとノイズになってしまい、ユーザが目的とする音声付画像の音声を聞き分けられない可能性がある。そのため、S904で検索された画像が多い場合には、S905で音声付画像の音像定位及び音量の制御を行う対象を、現在の表示範囲から近い順に、それまでに音像定位及び音量の制御が行われた音声付画像と合わせてN個までに制限してもよい。
また、上述の実施形態においては、スクロール操作等により表示範囲を変更しようとする操作が行われている時のみ、検索モードに移行する。それ以外は、表示画面中に存在する音声付画像の音声を聴くことができる通常モードで動作する。この構成によれば、ユーザは、自由に2つの動作モードを選択することができる。
また、実施形態の構成によれば、表示画面外の音声付画像の音声の音像制御がなされるため、ユーザは音声情報だけでどちらの方向に画像が隠れているかを推測することが容易である。
なお、画像データは動画に限定されず、静止画でもよいことは言うまでも無い。また、本実施形態では4チャンネルのスピーカの構成を例示した。しかし、本発明は特定のチャンネル数に限定されるものではない、例えば、5.1チャンネルスピーカへの展開も可能である。
以下、S903での制御処理例を詳しく説明する。以下では、表示画面外の座標に関連付けられていた音声付画像が次のタイミングで表示画面内の座標へ移動した場合に、その音声の発音をM秒間継続後に消音させる制御を行う例を説明する。
まず、図10で具体的な再生状態イメージを説明する。(a)は、タイミングTでの地図データの状態、(b)は、次のタイミングT+1での地図データの状態を図示したものである。つまり、(a)から単位時間経過後の状態が(b)である。具体的には、検索モード実行中のタイミングTからタイミングT+1への遷移時に、ユーザがパンニング操作を行った状態を示している。なお、図2と同様に、実線で示される四角枠10は画像表示部170の表示画面の外郭を示し、破線で示される四角枠20は表示画面外周領域の外郭を示す。また、符号Index−1、Index−2、Index−3、Index−4はその座標位置に存在する音声付画像を示す。
ここで、図10(a)に示すタイミングTの状態においては、検索モードで動作しているから、表示画面内の音声付画像Index−1、Index−2については、画像は表示されるが、その音声は消音される。また、表示画面外の音声付画像Index−3、Index−4については、画像は表示されないがその画像に付随する音声は発音される。
図10(b)に示すタイミングT+1の状態では、表示画面内の音声付画像Index−1、Index−2については、画像は表示されるがその音声は消音されている状態が継続される。そして、表示画面外から表示画面内へ移動してきた音声付画像Index−3については、画像が表示されるとともにその音声も発音される。そして、表示画面外の音声付画像Index−4については、(a)と同様、画像は表示されないがその音声は発音されている状態が継続される。ここで重要な点は、タイミングTで表示画面の外周領域に存在し発音されていた音声付画像が、次のタイミングT+1で表示画面内へ移動した場合は、その発音を所定時間継続し(例えばM秒間)、その所定時間経過後に消音させることである。
この動作の具体的な制御手順を、図9を用いて説明する。
上述したように、検索モードにおいては、CPU160は、S904からS908までの処理で選択された音声付画像を「近傍画像」として、RAM200に記録する(S911)。そして、次の検索モードでの動作機会において、CPU160は、表示画面の座標を座標記憶部110から読み出し、RAM200に格納する(S901)。CPU160は、ユーザによる検索操作により、直前のタイミングにおいて表示画面外の座標に関連付けられていた音声付画像が、現在のタイミングで表示画面内の座標へ移動していないかを検査する(S902)。つまり、CPU160は、座標記憶部110から読み出した表示画面の座標を参照し、RAM200に記憶されている「近傍画像」中に、現在の表示画面の座標内に存在するものが無いかを検査する。表示画面内へ移動してきた近傍画像が無い場合は通常の検索モードルーチンとなりS904へ移行する。表示画面内へ移動してきた近傍画像が有る場合はS903へ移行し、当該近傍画像の音像定位及び音量の制御、並びに発音時間の制御を行う。ここで、当該近傍画像の音像定位及び音量の制御は、S911においてRAM200へ記録した時の設定値をそのまま使用する。そして、発音時間はM秒間継続させるようにタイマーを起動させる。これは、表示画面外で発音されていた音声付画像が表示画面内へ移動してきた場合に突然消音してしまうと、その移動してきた音声付画像の存在をユーザが認識できなくなる事態を防ぐための措置である。したがって、タイマー時間は5秒程度が適当であろう。また、発音から消音へ移行する場合の音量制御は突然音量をゼロへ移行せず、徐々に音量を減少させながら消音させるとよい。
以上説明したS903の制御によれば、表示画面外で発音されていた音声付画像が表示画面内へ移動してきた場合に、突然それが消音してしまい、その移動してきた音声付画像の存在をユーザが認識できなくなる事態を防ぐことができる。
以上、本発明の実施形態を説明した。なお、CPU160の制御は1つのハードウェアが行ってもよいし、複数のハードウェアが処理を分担することで、装置全体の制御を行ってもよい。
また、本発明をその好適な実施形態に基づいて詳述してきたが、本発明はこれら特定の実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の様々な形態も本発明に含まれる。さらに、上述した各実施形態は本発明の一実施形態を示すものにすぎず、各実施形態を適宜組み合わせることも可能である。
また、本発明は、地図データ等をスクロール操作等しながら表示可能なさまざまな装置に適用することができる。すなわち、本発明は、カーナビゲーション装置をはじめ、パーソナルコンピュータやPDA、携帯電話端末や携帯型の画像ビューワ、デジタルフォトフレーム、音楽プレーヤー、ゲーム機、電子ブックリーダーなどに適用可能である。
(他の実施形態)
本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)をネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(又はCPUやMPU等)がプログラムコードを読み出して実行する処理である。この場合、そのプログラム、及び該プログラムを記憶した記憶媒体は本発明を構成することになる。

Claims (9)

  1. 複数チャンネルに分けて音声を出力手段に出力する出力制御手段と、
    表示手段に、地図を表示するとともに、座標データ及び音声データが関連付けられた音声付画像を、該座標データが示す前記地図の座標位置にマッピングして表示する表示制御手段と、
    前記表示手段により現在表示されている音声付画像に関連付けられた音声データに対応する音声について、該音声付画像に関連付けられた座標データが示す位置に応じて前記出力手段の各チャンネルから出力される音量を制御する第1の制御手段と、
    前記地図の表示範囲を変更する操作がされている場合、前記表示手段により現在表示されている音声付画像に関連付けられた音声データに対応する音声については消音し、現在表示されていない音声付画像であって、座標データが現在の表示範囲の所定の外周領域における位置を示す音声付画像に関連付けられた音声データに対応する音声について、当該位置に応じて前記出力手段の各チャンネルから出力される音量を制御する第2の制御手段と、
    を有し、
    前記第2の制御手段は、座標データが前記所定の外周領域における位置を示す音声付画像が複数ある場合は、該複数の音声付画像の各々に関連付けられた音声データに対応する音声について、当該音声付画像に関連付けられた座標データが示す位置に応じて音量を制御した後、それぞれの音声を合成出力するように構成され、
    前記所定の外周領域は、第1の外周領域と、該第1の外周領域の更に外周の第2の外周領域とを含み、
    前記第2の制御手段は、座標データが前記第1の外周領域における位置を示す音声付画像が所定数以上ある場合は、座標データが前記第2の外周領域における位置を示す音声付画像についての音声の前記合成出力を行わない
    ことを特徴とする画像情報処理装置。
  2. 前記第1の制御手段は、更に、前記表示手段により表示されている音声付画像に関連付けられた座標データが示す位置が表示画面の中心から遠いほど、該音声付画像に関連付けられた音声データに対応する音声の音量を小さくすることを特徴とする請求項1に記載の画像情報処理装置。
  3. 前記第2の制御手段は、更に、座標データが前記所定の外周領域における位置を示す音声付画像について、該位置が表示画面から遠いほど、該音声付画像に関連付けられた音声データに対応する音声の音量を小さくすることを特徴とする請求項1又は2に記載の画像情報処理装置。
  4. 前記第1の制御手段は、前記表示手段により現在表示されている音声付画像が複数ある場合は、該複数の音声付画像の各々に関連付けられた音声データに対応する音声について、当該音声付画像に関連付けられた座標データが示す位置に応じて音量を制御した後、それぞれの音声を合成出力することを特徴とする請求項1乃至3のいずれか1項に記載の画像情報処理装置。
  5. 前記第2の制御手段は、タイミングTにおいて前記表示手段により表示されていなかったが、前記地図の表示範囲を変更する操作がされたことにより単位時間経過後のタイミングT+1において前記表示手段により表示されるようになった音声付画像に関連付けられた音声データに対応する音声については、発音を所定時間継続した後に消音させることを特徴とする請求項1乃至のいずれか1項に記載の画像情報処理装置。
  6. 前記第2の制御手段は、タイミングTにおいて前記表示手段により表示されていなかったが、前記地図の表示範囲を変更する操作がされたことにより単位時間経過後のタイミングT+1において前記表示手段により表示されるようになった音声付画像に関連付けられた音声データに対応する音声については、発音を所定時間継続した後、徐々に音量を減少させながら消音させることを特徴とする請求項に記載の画像情報処理装置。
  7. 複数チャンネルに分けて音声を出力する出力手段と、地図を表示するとともに、座標データ及び音声データが関連付けられた音声付画像を、該座標データが示す前記地図の座標位置にマッピングして表示する表示手段とを有する画像情報処理装置の制御方法であって、
    第1の制御手段が、前記表示手段により現在表示されている音声付画像に関連付けられた音声データに対応する音声について、該音声付画像に関連付けられた座標データが示す位置に応じて前記出力手段の各チャンネルから出力される音量を制御する第1の制御ステップと、
    第2の制御手段が、前記地図の表示範囲を変更する操作がされている場合、前記表示手段により現在表示されている音声付画像に関連付けられた音声データに対応する音声については消音し、現在表示されていない音声付画像であって、座標データが現在の表示範囲の所定の外周領域における位置を示す音声付画像に関連付けられた音声データに対応する音声について、当該位置に応じて前記出力手段の各チャンネルから出力される音量を制御する第2の制御ステップと、
    を有し、
    前記第2の制御ステップは、座標データが前記所定の外周領域における位置を示す音声付画像が複数ある場合は、該複数の音声付画像の各々に関連付けられた音声データに対応する音声について、当該音声付画像に関連付けられた座標データが示す位置に応じて音量を制御した後、それぞれの音声を合成出力するステップを含み、
    前記所定の外周領域は、第1の外周領域と、該第1の外周領域の更に外周の第2の外周領域とを含み、
    前記第2の制御ステップは、座標データが前記第1の外周領域における位置を示す音声付画像が所定数以上ある場合は、座標データが前記第2の外周領域における位置を示す音声付画像についての音声の前記合成出力を行わない
    ことを特徴とする画像情報処理装置の制御方法。
  8. コンピュータを、請求項1乃至のいずれか1項に記載された画像情報処理装置の各手段として機能させるためのプログラム。
  9. コンピュータを、請求項1乃至のいずれか1項に記載された画像情報処理装置の各手段として機能させるためのプログラムを格納したコンピュータが読み取り可能な記憶媒体。
JP2011026525A 2011-02-09 2011-02-09 画像情報処理装置及びその制御方法 Expired - Fee Related JP5754967B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2011026525A JP5754967B2 (ja) 2011-02-09 2011-02-09 画像情報処理装置及びその制御方法
US13/361,410 US20120201404A1 (en) 2011-02-09 2012-01-30 Image information processing apparatus and control method therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011026525A JP5754967B2 (ja) 2011-02-09 2011-02-09 画像情報処理装置及びその制御方法

Publications (3)

Publication Number Publication Date
JP2012169704A JP2012169704A (ja) 2012-09-06
JP2012169704A5 JP2012169704A5 (ja) 2014-03-13
JP5754967B2 true JP5754967B2 (ja) 2015-07-29

Family

ID=46600639

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011026525A Expired - Fee Related JP5754967B2 (ja) 2011-02-09 2011-02-09 画像情報処理装置及びその制御方法

Country Status (2)

Country Link
US (1) US20120201404A1 (ja)
JP (1) JP5754967B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170039379A (ko) * 2015-10-01 2017-04-11 삼성전자주식회사 전자 장치 및 이의 제어 방법
CN110021297A (zh) * 2019-04-13 2019-07-16 上海影隆光电有限公司 一种基于音视频识别的智能显示方法及其装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09190544A (ja) * 1996-01-12 1997-07-22 Hitachi Ltd 画像データの音響提示方法
JPH09304090A (ja) * 1996-05-21 1997-11-28 Canon Inc 地図情報処理装置
US6593956B1 (en) * 1998-05-15 2003-07-15 Polycom, Inc. Locating an audio source
JP2001056232A (ja) * 1999-08-20 2001-02-27 Alpine Electronics Inc ナビゲーション装置
JP2002131072A (ja) * 2000-10-27 2002-05-09 Yamaha Motor Co Ltd 位置案内システム、位置案内シミュレーションシステム及びナビゲーションシステム、並びに位置案内方法
JP2007240480A (ja) * 2006-03-13 2007-09-20 Xanavi Informatics Corp 車載地図表示装置
WO2008139018A1 (en) * 2007-05-09 2008-11-20 Savox Communications Oy Ab (Ltd) A display apparatus
US8194117B2 (en) * 2007-08-08 2012-06-05 Qnx Software Systems Limited Video phone system
US20100293468A1 (en) * 2009-05-12 2010-11-18 Sony Ericsson Mobile Communications Ab Audio control based on window settings

Also Published As

Publication number Publication date
US20120201404A1 (en) 2012-08-09
JP2012169704A (ja) 2012-09-06

Similar Documents

Publication Publication Date Title
EP2517484B1 (en) Methods, apparatuses and computer program products for facilitating efficient browsing and selection of media content & lowering computational load for processing audio data
US11758329B2 (en) Audio mixing based upon playing device location
KR101703388B1 (ko) 오디오 프로세싱 장치
EP3236346A1 (en) An apparatus and associated methods
CN106790940B (zh) 录音方法、录音播放方法、装置及终端
US11212637B2 (en) Complementary virtual audio generation
US20200145778A1 (en) An apparatus and associated methods
JP5754967B2 (ja) 画像情報処理装置及びその制御方法
KR20180006798A (ko) 디스플레이장치와, 기록매체
CN108141693B (zh) 信号处理设备、信号处理方法和计算机可读存储介质
WO2023231787A1 (zh) 音频处理方法和装置
JP2019068210A (ja) 音響信号のミキシング装置及びプログラム
US10200606B2 (en) Image processing apparatus and control method of the same
US20230370801A1 (en) Information processing device, information processing terminal, information processing method, and program
JP6456171B2 (ja) 情報処理装置、情報処理方法及びプログラム
CN113632060A (zh) 用于指示在虚拟空间中呈现的音频内容的可听性的设备、方法、计算机程序或系统
WO2017026387A1 (ja) 映像処理装置、映像処理方法および記録媒体
EP3321795A1 (en) An apparatus and associated methods
KR20190081163A (ko) 입체 음향 컨텐츠 저작 툴을 이용한 선택적 광고 제공 방법 및 이를 위한 어플리케이션
KR20190079993A (ko) 입체 음향 컨텐츠 저작 방법 및 이를 위한 어플리케이션
US20240223950A1 (en) Ultra-low frequency sound compensation method and system based on haptic feedback, and computer-readable storage medium
JP6693180B2 (ja) 収録データ解析方法および収録データ解析装置
CN117597945A (zh) 音频播放方法、装置及存储介质
CN116057927A (zh) 信息处理装置、信息处理终端、信息处理方法和程序
KR20190082056A (ko) 입체 음향 컨텐츠 저작 툴을 이용한 선택적 광고 제공 방법 및 이를 위한 어플리케이션

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140128

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140128

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150206

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150409

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150427

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150526

LAPS Cancellation because of no payment of annual fees