JP2013062652A - 情報処理装置、情報処理方法およびコンピュータプログラム - Google Patents
情報処理装置、情報処理方法およびコンピュータプログラム Download PDFInfo
- Publication number
- JP2013062652A JP2013062652A JP2011199227A JP2011199227A JP2013062652A JP 2013062652 A JP2013062652 A JP 2013062652A JP 2011199227 A JP2011199227 A JP 2011199227A JP 2011199227 A JP2011199227 A JP 2011199227A JP 2013062652 A JP2013062652 A JP 2013062652A
- Authority
- JP
- Japan
- Prior art keywords
- focus value
- focus
- audio data
- audio
- program
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Television Receiver Circuits (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Abstract
【課題】周波数分割多重処理により複数のコンテンツの音声を出力するとき、視聴者にとって最適な状態で各音声を出力できるようにする情報処理装置を提供する。
【解決手段】本情報処理装置は、同時に出力される複数の音声データに関連するトリガー情報に基づいて、各音声データの強調の度合いを示すフォーカス値の割合を設定するフォーカス割合設定部と、設定されたフォーカス値で前記各音声データを合成する音声処理部と、を備える。
【選択図】図1
【解決手段】本情報処理装置は、同時に出力される複数の音声データに関連するトリガー情報に基づいて、各音声データの強調の度合いを示すフォーカス値の割合を設定するフォーカス割合設定部と、設定されたフォーカス値で前記各音声データを合成する音声処理部と、を備える。
【選択図】図1
Description
本開示は、複数のコンテンツの音声出力を調整する情報処理装置、情報処理方法およびコンピュータプログラムに関する。
視聴者が複数のコンテンツの音声を同時に聞き分けできる音声信号処理技術が本願発明者らにより提案されている(例えば、特許文献1〜5)。この技術では、複数の音声信号について周波数帯域を分割して生成された分割帯域の割り当ておよび周波数成分の抽出、時分割、周期的な変調、加工、定位の割り当てを行い、音声信号の分離情報および強調の度合いに係る情報を付加する。分割帯域の割り当ては互いに聴覚的にマスキングされない周波数帯域を割り当てる。そして、これらの音声信号を混合して出力することで、視聴者に複数の音声を聴覚上分離して同時に聞かせることができる。分割帯域の割り当て量を変えることで、音声の強調の度合いを変えることができる。この音声の強調の度合いパラメータをフォーカス値と呼んでいる。要約すると、この音声信号処理技術は、各音声の強調の度合いであるフォーカス値を反映させ、かつ、聴覚上分離して認識できる複数の音声信号を生成することができる技術である。
ところで、近年、液晶方式やプラズマ方式等、テレビの画面は薄型化、大型化している。画面サイズが大きくなることにより、1つのテレビの画面に複数の表示エリアを設定し、各表示リアに異なるコンテンツ(テレビ番組やビデオ)をそれぞれ表示させることが可能となった。これにより、ユーザは複数のコンテンツの映像を同時に見ることができる。
しかしながら、複数の表示エリアにそれぞれ異なるコンテンツの映像を表示させることができるものの、音声は1つのコンテンツの音声しか出力できなかった。複数のコンテンツの音声を同時に出力すると、視聴者が音声を聞き分けることができないためである。そこで、本願発明者らは、上記の音声信号処理技術を応用して各コンテンツの音声を聴覚上分離して認識できるように出力し、視聴者にとって最適な状態で各音声を出力できることを検討した。
本開示によれば、同時に出力される複数の音声データに関連するトリガー情報に基づいて、前記各音声データの強調の度合いを示すフォーカス値の割合を設定するフォーカス割合設定部と、設定されたフォーカス値で前記各音声データを合成する音声処理部と、を備える、情報処理装置が提供される。
また、本開示によれば、同時に出力される複数の音声データに関連するトリガー情報に基づいて、各音声データの強調の度合いを示すフォーカス値の割合を設定するステップと、設定されたフォーカス値で前記各音声データを合成するステップと、を含む、情報処理方法が提供される。
さらに、本開示によれば、コンピュータを、同時に出力される複数の音声データに関連するトリガー情報に基づいて、各音声データの強調の度合いを示すフォーカス値の割合を設定するフォーカス割合設定部と、設定されたフォーカス値で前記各音声データを合成する音声処理部と、を備える、情報処理装置として機能させるコンピュータプログラムが提供される。
本開示によれば、同時に出力される音声データの各フォーカス値をトリガー情報に基づいて変更することで、各音声データに適した適切な明瞭さで各音声を出力させることができる。
以上説明したように本開示によれば、コンテンツの視聴者が各音声をそれぞれ自由に調整できるようになる。
以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
なお、説明は以下の順序で行うものとする。
<1.複数のコンテンツの音声を同時出力する音声出力システム>
[1−1.システム概要]
[1−2.リモコン構成]
[1−3.画面サイズとフォーカス値との連動]
<2.音声出力システムの構成>
[2−1.概念説明]
[2−2.ハードウェア構成例]
(2−2−1.テレビ)
(2−2−2.リモコン)
[2−3.テレビおよびリモコンの実施構成例]
<3.音声出力システムの適用例>
<1.複数のコンテンツの音声を同時出力する音声出力システム>
[1−1.システム概要]
[1−2.リモコン構成]
[1−3.画面サイズとフォーカス値との連動]
<2.音声出力システムの構成>
[2−1.概念説明]
[2−2.ハードウェア構成例]
(2−2−1.テレビ)
(2−2−2.リモコン)
[2−3.テレビおよびリモコンの実施構成例]
<3.音声出力システムの適用例>
<1.複数のコンテンツの音声を同時出力する音声出力システム>
[1−1.システム概要]
まず、図1を参照して、本開示の実施形態に係る複数のコンテンツの音声を同時出力する音声出力システムについて説明する。なお、図1は、本実施形態に係る音声出力システムをテレビに適用した場合の状況を示す説明図である。
[1−1.システム概要]
まず、図1を参照して、本開示の実施形態に係る複数のコンテンツの音声を同時出力する音声出力システムについて説明する。なお、図1は、本実施形態に係る音声出力システムをテレビに適用した場合の状況を示す説明図である。
本実施形態では、画面に2つの表示エリアを有する2画面テレビに対して本実施形態に係る音声出力システムを適用し、2つの番組を同時に視聴する場合を一例として説明する。もちろん、本技術は後述するようにかかる例に限定されず、2以上の画面や音声を出力する装置に対しても適用可能である。また、当該システムを適用する対象も、テレビに限定されず、パーソナルコンピュータやPDA、カーナビゲーション等の情報機器の表示部にて複数のコンテンツを再生あるいは実行する場合にも適用可能である。
図1に示すように、視聴者がテレビ100で2つの番組を視聴しているとする。テレビ100の表示部110には第1の表示エリア112および第2の表示エリア114があり、各表示エリア112、114にはそれぞれ番組が表示される。また、表示エリア112、114に表示されている各番組の音声がスピーカ(図示せず。)から出力される。本実施形態に係る音声出力システムでは、例えば、特許文献1〜5に開示される周波数分割多重処理を用いており、複数の楽曲等の音声を同時かつ選択的に聞き分け可能に提供する。この周波数分割多重処理では、複数の音を混合しても同時に聞き分けでき、また、音量ではなくフォーカスというパラメータによって複数の音声を処理することができる。
ここで、フォーカスとは音の強調の度合いを表すパラメータであり、その値(「フォーカス値」と称する。)は例えば0〜100の値をとる。したがって、101段階のステップで音声のフォーカスの値を変化させることができる。フォーカス値が大きいほど音声をはっきりと聞こえるように出力させることができ、フォーカス値が小さいほど音声はぼかされて出力される。
各番組の音声は、テレビ100を操作するためのリモートコントローラ(以下、「リモコン」と略する。)200により変更することができる。本実施形態に係るリモコン200には、例えば表示部110の表示エリアを1つにする1画面モードと2つにする2画面モードとで切り替える表示モード切替ボタンや、2画面モードにおいて各番組の音声に対するフォーカス値の割合を変更するフォーカス値割合変更スライダー等が設けられる。ユーザは、フォーカス割合変更スライダーを用いて各番組のフォーカス値の割合を変更させることで、興味のある番組の音声をよりはっきりと出力させることができるとともに、他の番組の音声も邪魔にならずかつ認識可能なさりげない音質で出力できる。すなわち、視聴者の興味の度合いに応じた音質に変更できる。これにより、各視聴者の興味を満足させつつ、視聴者間で時間と場所を共有することができる。
[1−2.リモコン構成]
図2に、本実施形態に係るリモコン200の一構成例を示す。図2では、リモコン200の操作入力部のうち、選局ボタン210、220およびフォーカス割合変更スライダー230を示している。
図2に、本実施形態に係るリモコン200の一構成例を示す。図2では、リモコン200の操作入力部のうち、選局ボタン210、220およびフォーカス割合変更スライダー230を示している。
リモコン200には、通常のテレビのリモコンと同様に、電源ボタンや選局ボタン(符号210、220)、音量調節ボタン、表示モード切替ボタン等が設けられている。これらの操作入力部は、物理的に押下したりスライドしたりといった操作が可能な入力部であってもよく、リモコン200の表示部にタッチパネル等を用いて構成されたソフトウェア入力部であってもよい。タッチパネルを用いた入力部の場合、表示部に仮想的にボタンやスライダー等が表示される。ユーザは、画面に対してタッチ等の操作入力を行うことで、ソフトウェア入力部を操作することができる。
本実施形態に係るリモコン200は、表示モード切替ボタンにより2画面モードが選択されているときに各表示エリア112、114に表示させる番組を容易に選択できるように、2つの選局ボタン210、220を備えている。選局ボタン210、220は、チャンネルと対応する10個のチャンネルボタンから構成されている。選局ボタン210のチャンネルボタンを操作すると、第1の表示エリア112に表示させる番組を選択することができ、選局ボタン220のチャンネルボタンを操作すると、第2の表示エリア114に表示させる番組を選択することができる。すなわち、選局ボタンは、表示部110に設定可能な表示エリアの数だけ設けられる。これにより、操作対象の表示エリアを選択する必要はなく、直接所望の表示エリアの番組を設定することができる。
また、リモコン200には、2画面モード時の各表示エリア112、114に表示される番組の音声について、フォーカス割合を調整する音声調節部としてフォーカス割合変更スライダー230が設けられている。第1の表示エリア112で選択されているチャンネルをCH1、第2の表示エリア114で選択されているチャンネルをCH2とする。フォーカス割合変更スライダー230には、図2に示すように、直線上を移動可能なスライド部232が設けられている。スライド部232の直線上の位置に応じてチャンネルCH1とCH2とのフォーカス割合が設定される。
スライド部232を直線のチャンネルCH1側の端部に位置させると、チャンネルCH1とCH2とのフォーカス割合は100:0となり、チャンネルCH1の音声がはっきりと聞こえるように調整される。一方、スライド部232を直線のチャンネルCH2側の端部に位置させると、チャンネルCH1とCH2とのフォーカス割合は0:100となり、チャンネルCH2の音声がはっきりと聞こえるように調整される。直線の中央にスライド部232を位置させると、チャンネルCH1とCH2とのフォーカス割合は50:50となり、チャンネルCH1およびCH2の音声が同等に聞こえるように調整される。スライド部232を移動させることにより、連続的にフォーカス割合を変更することができる。
なお、図2では、フォーカス値割合を変更する音声調節部をスライダー型としたが、本技術はかかる例に限定されない。例えば、図3に示すように、つまみ型のフォーカス値割合変更部230Aとしてもよい。つまみ型のフォーカス値割合変更部230Aでは、基準位置からのつまみ部232Aの回転角度に基づいて、チャンネルCH1、CH2のフォーカス値割合を変更することができる。例えば、つまみ部232Aを反時計回りに回すとチャンネルCH2に対してチャンネルCH1のフォーカス値割合を大きくすることができ、つまみ部232Aを時計回りに回すとチャンネルCH1に対してチャンネルCH2のフォーカス値割合を大きくすることができる。また、図3の例では1つのつまみ型のフォーカス値割合変更部230Aで2つのチャンネルのフォーカス値割合を調整したが、本技術はかかる例に限定されない。例えば各チャンネルにそれぞれ対応するつまみ型のフォーカス値割合変更部230Aを設けてもよい。
あるいは、数値入力型のフォーカス値割合変更部230Bとしてもよい。数値入力型のフォーカス値割合変更部230Bでは、視聴者はテンキー232Bを用いて1つのチャンネル(例えばチャンネルCH1)のフォーカス値を入力する。そうすると、もう1つのチャンネル(例えばチャンネルCH2)のフォーカス値が自動的に決定される。
このように、フォーカス値割合を変更する操作入力部の形状は、リモコン200の構成や使用形態に応じて適宜決定することができる。
リモコン200は、通信部240を介してテレビ100と無線通信を行う。通信部240の通信方式は、例えば赤外線通信方式でもよく、無線LANを利用した通信方式でもよい。かかる通信部240により、リモコン200から入力された入力情報をテレビ100に通知することができる。
[1−3.画面サイズとフォーカス値との連動]
本実施形態では、テレビ100を2画面モードで使用しているとき、表示エリアのサイズと音声のフォーカス値とを連動して変動させる。一般に、視聴者は、2つの番組のうち音声のフォーカス値を高く設定した番組を主として視聴したいと考えられる。そこで、フォーカス値割合変更スライダー230により設定されたフォーカス値割合に応じて、2つの表示エリア112、114のサイズを変更し、視聴者が視聴したい番組をよりはっきりと視聴できるようにする。
本実施形態では、テレビ100を2画面モードで使用しているとき、表示エリアのサイズと音声のフォーカス値とを連動して変動させる。一般に、視聴者は、2つの番組のうち音声のフォーカス値を高く設定した番組を主として視聴したいと考えられる。そこで、フォーカス値割合変更スライダー230により設定されたフォーカス値割合に応じて、2つの表示エリア112、114のサイズを変更し、視聴者が視聴したい番組をよりはっきりと視聴できるようにする。
例えば、フォーカス値割合変更スライダー230の設定と表示エリア112、114との対応は以下のように設定することができる。スライド部232の位置が表示エリア112に表示されるチャンネルCH1側端部に位置されたとき、表示エリア112の画面サイズが最大となり、表示エリア114の画面サイズは最小となる。一方、スライド部232の位置が表示エリア114に表示されるチャンネルCH2側端部に位置されたとき、表示エリア114の画面サイズが最大となり、表示エリア112の画面サイズは最小となる。直線の中央にスライド部232を位置させると、表示エリア112、114の画面サイズは同サイズとなる。
すなわち、表示エリア112、114の画面サイズが0〜100の割合で表されるとすると、以下の関係が成り立つ。
(A1)チャンネルCH1の表示エリアの画面サイズ=スライド部の位置
(B1)チャンネルCH2の表示エリアの画面サイズ=100−(スライド部の位置)
(C1)チャンネルCH1の表示エリアの画面サイズ
+チャンネルCH2の表示エリアの画面サイズ=100
(A1)チャンネルCH1の表示エリアの画面サイズ=スライド部の位置
(B1)チャンネルCH2の表示エリアの画面サイズ=100−(スライド部の位置)
(C1)チャンネルCH1の表示エリアの画面サイズ
+チャンネルCH2の表示エリアの画面サイズ=100
また、上述したフォーカス値については、以下の関係が成り立つ。
(A2)チャンネルCH1の音声のフォーカス値=スライド部の位置
(B2)チャンネルCH2の音声のフォーカス値=100−(スライド部の位置)
(C2)チャンネルCH1の音声のフォーカス値
+チャンネルCH2の音声のフォーカス値=100
(A2)チャンネルCH1の音声のフォーカス値=スライド部の位置
(B2)チャンネルCH2の音声のフォーカス値=100−(スライド部の位置)
(C2)チャンネルCH1の音声のフォーカス値
+チャンネルCH2の音声のフォーカス値=100
このように、スライド部232を移動させることにより、音声のフォーカス値および表示エリア112、114の画面サイズを連続的に変更することができる。一具体例を図4に示す。図4左には、フォーカス値割合変更スライダー230のスライド部232の位置が80の位置にある場合を示している。このとき、チャンネルCH1の音声のフォーカス値は80となり、表示エリア112の画面サイズも80となる。一方、チャンネルCH2の音声のフォーカス値は20となり、表示エリア114の画面サイズも20となる。したがって、チャンネルCH1の番組をはっきりと視聴できるようになる。
図4中央には、フォーカス値割合変更スライダー230のスライド部232の位置が50の位置にある場合を示している。このとき、チャンネルCH1およびCH2ともに音声のフォーカス値は50となり、表示エリア112、114の画面サイズも50となる。したがって、チャンネルCH1、CH2の番組を同じ画面サイズ、音声のフォーカス値で視聴することができるようになる。
そして、図4右には、フォーカス値割合変更スライダー230のスライド部232の位置が30の位置にある場合を示している。このとき、チャンネルCH1の音声のフォーカス値は30となり、表示エリア112の画面サイズも30となる。一方、チャンネルCH2の音声のフォーカス値は70となり、表示エリア114の画面サイズも70となる。したがって、チャンネルCH2の番組をはっきりと視聴できるようになる。
テレビ100の表示部110には、フォーカス値割合変更スライダー230にて設定されたフォーカス値を表示エリア112、114に表示してもよい(図1の符号116、118)。このようにフォーカス値を表示することにより、視聴者は現在のフォーカス値を確認することができる。
なお、本例では、表示エリア112、114の画面サイズと音声のフォーカス値とを同じ値に設定したが、本技術はかかる例に限定されない。例えば視聴者の好みに応じて、画面サイズの変化率と音声のフォーカス値とを別々に設定してもよい。例えば図5に示すように、表示エリア112に表示される番組の音声のフォーカス値を設定するスライダー230aと、表示エリア114に表示される番組の音声のフォーカス値を設定するスライダー230bとを別々に設けてもよい。また、表示エリア112および表示エリア114の画面サイズを設定する表示エリア調節部としてスライダー250a、250bをそれぞれ設けてもよい。これにより、各スライダーのスライド部232a、232b、252a、252bの位置を動かすことで、各番組の音声のフォーカス値および表示エリア112、114の画面サイズを独立して設定することができる。
なお、図5に示す例では、チャンネルCH1とチャンネルCH2の画面サイズと音声のフォーカス値を独立に設定可能にしているが、画面サイズの252a、252bの2つを連動させて一つにまとめて設定可能にしてもよい。また、音声のフォーカス値の232a、232bの2つを連動させて一つにまとめて設定可能にしてもよい。
また、本例では、表示モード切替ボタンにより1画面モードと2画面モードとを切り替えたが、本技術はかかる例に限定されない。例えばフォーカス値割合変更スライダー230のスライド部232の位置が100のとき1画面モードとし、スライド部232の位置が100以外のとき2画面モードとして、表示モード切替ボタンを用いることなく自動的に設定されるようにしてもよい。
<2.音声出力システムの構成>
[2−1.概念説明]
図6に、本実施形態に係る音声出力システムの処理を概念的に表したブロック図を示す。本実施形態に係る音声出力システムでは、表示エリア112にチャンネルCH1(プライマリ)の番組を、表示エリア114にチャンネルCH2(セカンダリ)の番組をそれぞれ表示する。
[2−1.概念説明]
図6に、本実施形態に係る音声出力システムの処理を概念的に表したブロック図を示す。本実施形態に係る音声出力システムでは、表示エリア112にチャンネルCH1(プライマリ)の番組を、表示エリア114にチャンネルCH2(セカンダリ)の番組をそれぞれ表示する。
例えば、チャンネルCH1の番組は、地上波デジタル放送等の放送波を受信・復調し、圧縮されたデータストリーム10を、動画デコーダーによりデコードすることにより得られる(P11)。デコードされたデータストリーム10は、画像データと音声データとに分離される。画像データは、指定された画像サイズにリサイズされた後(P12)、画像ミキサーを経由して画像出力装置へ出力される(P13)。一方、デコードの音声データは周波数分割多重処理により指定されたフォーカス値に処理された後(P14)、音声ミキサーを経由して音声出力装置へ出力される(P15)。
チャンネルCH2の番組の処理も、チャンネルCH1の番組の処理と同様に、まずデータスストリーム20をデコードして画像データと音声データとに分離する(P21)。そして、画像データを、指定された画像サイズにリサイズした後(P22)、画像ミキサーを経由して画像出力装置へ出力する(P23)。一方、デコードの音声データは周波数分割多重処理により指定されたフォーカス値に処理された後(P24)、音声ミキサーを経由して音声出力装置へ出力される(P25)。
チャンネルCH1の番組の画像および音声と、チャンネルCH2の番組の画像および音声とがそれぞれ出力されると、各画像は対応する表示エリア112、114に表示され、各音声はミックスして最終出力される。
[2−2.ハードウェア構成例]
(2−2−1.テレビ)
本実施形態に係るテレビ100は、図7に示すように、例えばCPU(Central Processing Unit)101と、ROM(Read Only Memory)102と、RAM(Random Access Memory)103とを備える。また、テレビ100は、受信装置104と、外部記憶装置/デコード回路105と、通信装置106と、画像/音声出力処理装置107と、バス108とを備える。
(2−2−1.テレビ)
本実施形態に係るテレビ100は、図7に示すように、例えばCPU(Central Processing Unit)101と、ROM(Read Only Memory)102と、RAM(Random Access Memory)103とを備える。また、テレビ100は、受信装置104と、外部記憶装置/デコード回路105と、通信装置106と、画像/音声出力処理装置107と、バス108とを備える。
CPU101は、演算処理装置および制御装置として機能し、各種プログラムに従ってテレビ100内の動作全般を制御する。また、CPU101は、マイクロプロセッサであってもよい。ROM102は、CPU101が使用するプログラムや演算パラメータ等を記憶する。RAM103は、CPU101の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を一時記憶する。これらはバス108により相互に接続されている。
受信装置104は、テレビ100の外部アンテナにて地上波デジタル放送等の放送波であるRF信号を受信する装置である。受信装置104は、受信したRF信号を増幅・復調する。復調された信号は、例えばMPEG等の方式で圧縮されており、複数の番組の信号が含まれている。外部記憶装置/デコード回路105は、受信装置104にて復調された信号をデコードし、画像データと音声データとにそれぞれ分離する。このとき、復調された信号に含まれる各番組について、それぞれ画像データと音声データとが生成される。
通信装置106は、リモコン200と通信するための通信インタフェースである。通信装置106は、赤外線通信装置であってもよく、無線LAN(Local Area Network)対応通信装置であってもよく、ワイヤレスUSB対応通信装置であってもよい。あるいは、通信装置106は、有線による通信を行うワイヤー通信装置であってもよい。
画像/音声出力処理装置107は、外部記憶装置/デコード回路105により分離して生成された画像データおよび音声データを出力する装置である。なお、これらの画像データおよび音声データは、画像/音声出力処理装置107に出力される前に画像処理および音声処理が施される。画像/音声出力装置107は、例えば画像データを表示する画像出力装置として液晶ディスプレイ装置や有機ELディスプレイ装置等を用いることができ、音声データを表示する音声出力装置としてスピーカ等を用いることができる。
(2−2−2.リモコン)
本実施形態に係るリモコン200は、図8に示すように、例えばCPU(Central Processing Unit)201と、ROM(Read Only Memory)202と、RAM(Random Access Memory)203とを備える。また、リモコン200は、ユーザインタフェース204と、通信装置205と、表示装置206と、バス207とを備える。
本実施形態に係るリモコン200は、図8に示すように、例えばCPU(Central Processing Unit)201と、ROM(Read Only Memory)202と、RAM(Random Access Memory)203とを備える。また、リモコン200は、ユーザインタフェース204と、通信装置205と、表示装置206と、バス207とを備える。
CPU201は、演算処理装置および制御装置として機能し、各種プログラムに従ってリモコン200内の動作全般を制御する。また、CPU201は、マイクロプロセッサであってもよい。ROM202は、CPU201が使用するプログラムや演算パラメータ等を記憶する。RAM203は、CPU201の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を一時記憶する。これらはバス207により相互に接続されている。
ユーザインタフェース204は、テレビ100を操作するための操作入力を行うための操作入力部である。ユーザインタフェース204は、上述したように、物理的なボタンやスライダー等により構成してもよく、タッチパネル付き液晶を用いてソフトウェアボタンやソフトウェアスライダー等を構成してもよい。なお、ソフトウェアボタン等の表示処理は、CPU201を表示処理部として機能させることにより行うことができる。通信装置205は、テレビ100と通信するための通信インタフェースである。通信装置205は、テレビ100の通信装置106と対応する装置が設けられ、例えば赤外線通信装置や、無線LAN対応通信装置、ワイヤレスUSB対応通信装置、あるいは有線による通信を行うワイヤー通信装置等を用いることができる。
表示装置206は、情報を表示する装置であって、液晶ディスプレイ装置や有機ELディスプレイ装置等を用いることができる。ユーザインタフェース204がソフトウェアボタン等により構成される場合には、表示装置206にこれらを表示することもできる。
[2−3.テレビおよびリモコンの実施構成例]
図9に、本実施形態に係るテレビ100およびリモコン200の一実施構成例を示す。なお、図9において、図7に示したテレビ100および図8に示したリモコン200と同一の機能部については同一の符号を付し、詳細な説明は省略する。また、図9では、図7および図8に示した構成要素の記載を一部省略している。
図9に、本実施形態に係るテレビ100およびリモコン200の一実施構成例を示す。なお、図9において、図7に示したテレビ100および図8に示したリモコン200と同一の機能部については同一の符号を付し、詳細な説明は省略する。また、図9では、図7および図8に示した構成要素の記載を一部省略している。
まず、リモコン200について説明すると、図9に示すように、リモコン200は、ユーザインタフェース204と、通信装置205と、表示装置206とを備える。これらの構成要素は図8に示したユーザインタフェース204、通信装置205、および表示装置206と同様に機能する。また、図9に示すリモコン200も、図8に示したCPU201、ROM202およびRAM203を備えている。
リモコン200のユーザインタフェース204は、表示モード切替ボタンやフォーカス値割合変更スライダー230等から構成されている。ユーザインタフェース204から入力された各番組の音声に対するフォーカス値の設定情報は、通信装置205を介してテレビ100の通信装置106へ送信される。
一方、テレビ100は、図9に示すように、受信装置104と、映像音響データデコード回路105aと、通信装置106と、画像出力装置107aおよび音声出力装置107bとを備える。また、テレビ100は、パラメータ取得部121と、フォーカス割合設定部122と、画像サイズ変更装置123と、画像ミキサー装置124と、音声処理装置125と、音声ミキサー装置126とをさらに備える。受信装置104および通信装置106は図7に示した受信装置104および通信装置106と同様に機能する。また、映像音響データデコード回路105aは外部記憶装置/デコード回路105に対応し、画像出力装置107aおよび音声出力装置107bは画像/音声出力装置107に対応する。
パラメータ取得部121は、通信装置106を介してリモコン200から送信された操作入力情報を表すパラメータを取得する。パラメータ取得部121は、例えば表示部110に表示する番組のチャンネルを表すチャンネル選択情報や、1画面モードあるいは2画面モードの切り替えを表す画面モード情報、音量を変更する音量情報、音声のフォーカス値の設定を表すフォーカス情報等を取得する。ここで、フォーカス情報は、フォーカス割合設定部122へ出力される。
フォーカス割合設定部122は、パラメータ取得部121から入力されたフォーカス情報に基づいて、画像サイズ変更装置123へ画像サイズ変更指示を出力し、音声処理装置125へ音声データ修正指示を出力する。フォーカス情報には、チャンネルCH1の音声のフォーカス値が含まれる。フォーカス割合設定部122は、入力されたチャンネルCH1の音声のフォーカス値に基づいて、上述の(B2)の関係に基づいてチャンネルCH2の音声のフォーカス値を算出する。
また、フォーカス値割合設定部122は、各チャンネルCH1、CH2のフォーカス値に基づいて、これらの画像データの表示エリア112、114の画面サイズを決定する。例えば、フォーカス割合と同様に画面サイズの割合が変更される場合には、チャンネルCH1とCH2とのフォーカス割合と同じ画面サイズ割合となるように表示エリア112、114の画面サイズが設定される。フォーカス割合設定部122は、設定された画面サイズを画像サイズ変更装置123へ出力し、フォーカス値を音声処理装置125へ出力する。
画像サイズ変更装置123は、フォーカス割合設定部122から入力された画像サイズ変更指示も基づいて、表示エリア112、114に表示する画像データの画像サイズを変更する。テレビ100は、外部アンテナ100aにて地上波デジタル放送等の放送波であるRF信号を受信装置104にて受信すると、受信装置104にて増幅・復調された信号が映像音響データデコード回路105aでデコードされる。上述したように、復調された信号には複数の番組の信号が含まれており、復調信号は番組毎に画像データと音声データとに分離される。
画像サイズ変更装置123は、映像音響データデコード回路105aにより画像データを受け取ると、フォーカス割合設定部122にて設定された表示エリアの画面サイズに適合するように、各表示エリアに対応する各画像データの画像サイズを変更する。画像サイズが変更された画像データは、画像ミキサー装置124を経由して画像出力装置107aへ出力される。
音声処理装置125は、映像音響データデコード回路105aにより音声データを受け取ると、フォーカス割合設定部122にて設定されたフォーカス値に適合するように、各番組の音声データを合成するフォーカス処理が行われる。フォーカス処理された音声データは、音声ミキサー装置126を経由して音声出力装置107bへ出力される。
以上、本実施形態に係る音声出力システムを適用したテレビ100およびリモコン200の構成とその機能について説明した。本技術によれば、フォーカス値割合設定部122により、複数の表示エリアに表示される番組の音声のフォーカス値を、フォーカス割合変更スライダー230により設定されたフォーカス情報に基づいて変更する。そして、音声処理装置125により、フォーカス割合設定部122にて設定されたフォーカス値に適合するように、各番組の音声データを合成する。これにより、視聴者が所望する番組の音声をよりはっきりと視聴できるとともに、他の番組についても音声を認識することが可能となる。また、音声のフォーカス割合に応じて表示エリアのサイズを変更してもよい。
<3.音声出力システムの適用例>
本実施形態に係る音声出力システムは、音声のフォーカス値を、出力される音声に関連するトリガー情報に基づき変更する。例えば、上述した例においては、フォーカス割合変更スライダー230のスライド部232がユーザにより操作されることで、フォーカス値割合設定部122により音声のフォーカス値が変更される。この場合、トリガー情報はフォーカス割合変更スライダー230の操作入力(スライド部232の位置に対応するフォーカス情報)となる。また、音声出力システムは、ユーザのいる環境や再生するコンテンツの内容に基づいて、フォーカス値割合設定部122により自動的にフォーカス値を変更することもできる。この場合、トリガー情報はユーザのいる環境や再生するコンテンツの内容となる。以下では、本実施形態に係る音声出力システムを適用し、トリガー情報に基づいて音声のフォーカス値を変更する処理例について説明する。
本実施形態に係る音声出力システムは、音声のフォーカス値を、出力される音声に関連するトリガー情報に基づき変更する。例えば、上述した例においては、フォーカス割合変更スライダー230のスライド部232がユーザにより操作されることで、フォーカス値割合設定部122により音声のフォーカス値が変更される。この場合、トリガー情報はフォーカス割合変更スライダー230の操作入力(スライド部232の位置に対応するフォーカス情報)となる。また、音声出力システムは、ユーザのいる環境や再生するコンテンツの内容に基づいて、フォーカス値割合設定部122により自動的にフォーカス値を変更することもできる。この場合、トリガー情報はユーザのいる環境や再生するコンテンツの内容となる。以下では、本実施形態に係る音声出力システムを適用し、トリガー情報に基づいて音声のフォーカス値を変更する処理例について説明する。
[適用例1]
例えば、家族がゲームをしている最中に視聴者Aがニュース番組を視聴したい場合、家族あるいは視聴者Aがリモコン200よりテレビ100の表示を2画面モードに切り替えることで、ゲームとニュース番組とを表示部110に表示させることができる。このとき、ニュース番組は音声から得られる内容を理解できればよいため、ユーザによりゲームの表示エリアがニュース番組の表示エリアより大きく設定されたとする(例えばゲームの表示エリアを70%、ニュース番組の表示エリアを30%に設定)。テレビ100は、リモコン200から表示エリアのサイズ変更指示を受信し、フォーカス割合設定部122により指定の表示エリアのサイズが設定され、画像サイズ変更装置123により指定されたサイズに各表示エリアが変更される。
例えば、家族がゲームをしている最中に視聴者Aがニュース番組を視聴したい場合、家族あるいは視聴者Aがリモコン200よりテレビ100の表示を2画面モードに切り替えることで、ゲームとニュース番組とを表示部110に表示させることができる。このとき、ニュース番組は音声から得られる内容を理解できればよいため、ユーザによりゲームの表示エリアがニュース番組の表示エリアより大きく設定されたとする(例えばゲームの表示エリアを70%、ニュース番組の表示エリアを30%に設定)。テレビ100は、リモコン200から表示エリアのサイズ変更指示を受信し、フォーカス割合設定部122により指定の表示エリアのサイズが設定され、画像サイズ変更装置123により指定されたサイズに各表示エリアが変更される。
このとき、フォーカス割合設定部122は、表示エリアのサイズの変更に応じて、音声のフォーカス値を変更する。ニュース番組の表示エリアは小さくてもよいが音声ははっきりと聞き取れるように、ニュース番組の音声のフォーカス値をゲームの音声のフォーカス値より大きくしてもよい。あるいは、表示サイズが小さいときには音声のフォーカス値も小さくするように設定してもよい。フォーカス割合設定部122にて設定されたフォーカス値の割合は音声処理装置125へ出力され、音声処理装置125により各番組の音声のフォーカス値が変更される。このように、表示されるコンテンツの内容や視聴者の要望をトリガー情報として表示エリアのサイズおよび音声のフォーカス値を設定することで、視聴者の要望に合った状況でコンテンツを視聴することが可能となる。
[適用例2]
他の例として、例えば、19時から放送されているドラマの視聴中に、毎日チェックしている19時25分から放送される天気予報があったとする。本実施形態に係るテレビ100は、この天気予報に関する情報(例えば番組名や番組を特定するID等)を保持することで、当該天気予報の放送が開始されると表示部110にポップアップ画面を自動的に表示して、視聴者に見せるようにする。すなわち、天気予報に関する情報をトリガー情報として、トリガー情報に一致する番組が放送されるときに表示部110に表示させる。このとき、ドラマの音声と天気予報の音声とが多重化されるとする。
他の例として、例えば、19時から放送されているドラマの視聴中に、毎日チェックしている19時25分から放送される天気予報があったとする。本実施形態に係るテレビ100は、この天気予報に関する情報(例えば番組名や番組を特定するID等)を保持することで、当該天気予報の放送が開始されると表示部110にポップアップ画面を自動的に表示して、視聴者に見せるようにする。すなわち、天気予報に関する情報をトリガー情報として、トリガー情報に一致する番組が放送されるときに表示部110に表示させる。このとき、ドラマの音声と天気予報の音声とが多重化されるとする。
この際、ドラマの視聴を妨げないように、フォーカス割合設定部122により、例えば表示部110の隅に小さなポップアップ画面が表示されるとともに、天気予報の音声のフォーカス値がドラマの音の妨げとならないように設定される。これにより、ドラマの視聴を妨げることなく天気予報の内容をユーザに通知することができる。そして、天気予報が終了するとポップアップ画面を非表示とし、ドラマのみが表示される画面に戻される。このとき、フォーカス割合設定部122は天気予報の音声のフォーカス値を0とし、消音する。天気予報の放送スケジュールは、例えば電子番組表を参照することにより取得可能であり、放送時間が変更されても当該天気予報が放送されるときにポップアップ画面により表示することができる。
[適用例3]
また、テレビ100において、2つの番組を2画面表示しているとき、通常フォーカス割合設定部122は、主番組(プライマリ)として視聴している番組の音声のフォーカス値を、副番組(セカンダリ)として視聴している番組の音声のフォーカス値より大きく設定する。これにより、ユーザは、主番組の情報を主として認識できる。ここで、主番組のCMが検出されると、フォーカス割合設定部122は、主番組側のCMの音声のフォーカス値より副番組の音声のフォーカス値を大きく設定する。その後、フォーカス割合設定部122主番組側のCM終了により主番組側のCMの音声のフォーカス値を大きく、副番組の音声のフォーカス値を小さく設定する。これにより、副番組の音声は、主番組の音声を妨げない程度に小さくされたり、あるいは消音されたりする。
また、テレビ100において、2つの番組を2画面表示しているとき、通常フォーカス割合設定部122は、主番組(プライマリ)として視聴している番組の音声のフォーカス値を、副番組(セカンダリ)として視聴している番組の音声のフォーカス値より大きく設定する。これにより、ユーザは、主番組の情報を主として認識できる。ここで、主番組のCMが検出されると、フォーカス割合設定部122は、主番組側のCMの音声のフォーカス値より副番組の音声のフォーカス値を大きく設定する。その後、フォーカス割合設定部122主番組側のCM終了により主番組側のCMの音声のフォーカス値を大きく、副番組の音声のフォーカス値を小さく設定する。これにより、副番組の音声は、主番組の音声を妨げない程度に小さくされたり、あるいは消音されたりする。
なお、主番組と副番組とは同時に2画面表示されていなくてもよく、例えば、通常は主番組のみを表示し、主番組のCMを検出すると、主番組のCM放送中は自動的に副番組の表示画面をポップアップ表示してもよい。この場合も、通常フォーカス割合設定部122は、主番組の音声のフォーカス値を副番組の音声のフォーカス値より大きく設定するが、主番組のCMが検出されると、主番組側のCMの音声のフォーカス値より副番組の音声のフォーカス値を大きく設定する。そして、主番組のCMが終了すると、副番組を表示しているポップアップ画面を非表示にして主番組のみを表示させるようにする。このとき、主番組側のCM終了により副番組の音声は主番組の音声を妨げない程度に小さくされたり、あるいは消音されたりする。
このように主番組側のCM開始をトリガー情報として通常時のフォーカス値の設定を変更することで、2つの番組の音声の強調の度合いを変化させ、ユーザにとって意味のある情報の音声を主として認識できるようにすることができる。
[適用例4]
さらに、テレビ100に予めキーワードを登録し、このキーワードに基づいて自動的にお知らせ画面をポップアップ表示させてもよい。すなわち、キーワードがトリガー情報となる。キーワードとしては、例えば「天気予報」等の番組ジャンルや、人物やグループ名等を用いることができる。主番組を1画面モードで表示させているときに、主番組以外で当該キーワードに一致する番組が放送されると、テレビ100は自動的に2画面モードとし、副番組として当該キーワードに一致する番組を表示する。キーワードに一致する番組の探索は、電子番組表を利用して行うことができる。
さらに、テレビ100に予めキーワードを登録し、このキーワードに基づいて自動的にお知らせ画面をポップアップ表示させてもよい。すなわち、キーワードがトリガー情報となる。キーワードとしては、例えば「天気予報」等の番組ジャンルや、人物やグループ名等を用いることができる。主番組を1画面モードで表示させているときに、主番組以外で当該キーワードに一致する番組が放送されると、テレビ100は自動的に2画面モードとし、副番組として当該キーワードに一致する番組を表示する。キーワードに一致する番組の探索は、電子番組表を利用して行うことができる。
ここで、キーワードに対して予め重要度を付与することもできる。これにより、フォーカス割合設定部122は、キーワードの重要度に応じて副番組の音声のフォーカス値を設定することができる。例えば、重要度の高いキーワードに一致する番組が検出されたとき、フォーカス割合設定部122は当該番組のフォーカス値を大きく(例えば、主番組の音声のフォーカス値と同一またはそれ以上に)設定することで、視聴者に当該番組の放送を強く通知することができる。一方、重要度の低いキーワードに一致する番組が検出されたときには、フォーカス割合設定部122は当該番組のフォーカス値を小さく(例えば、主番組の音声のフォーカス値より小さく)設定するようにしてもよい。
なお、異なるキーワードについて、一致する番組が複数検出された場合には、キーワードの重要度の最も高い番組のみをポップアップ画面で表示させてもよい。あるいは、キーワードの重要度に応じてポップアップ画面のサイズおよびフォーカス値を変化させて、すべての検出された番組をポップアップ表示させてもよい。
[適用例5]
また、テレビ100を視聴する視聴者の姿勢状態に応じて、番組の音声のフォーカス値を変化させてもよい。例えば、テレビ100に視聴者の視線を認識可能な視線認識センサが設けられているとする。例えば視線認識センサは既に実用化されているCCDセンサやCMOSセンサを使ったものを用いる。また視線認識ではないが、視聴状態の検出には、既に実用化されている赤外線センサを利用した人感センサを用いてもよい。このとき、フォーカス割合設定部122は、視線認識センサの検出結果をトリガー情報として、視聴者がテレビ100を見ていると判断される場合には番組のフォーカス値を大きくし、視聴者がテレビ100を見ていないと判断される場合には番組のフォーカス値を小さくする。なお、複数の番組が表示されている場合には、視聴者の視線の方向から視聴者が見ている番組を特定し、視聴者が見ていると特定した番組の音声のフォーカス値を他の番組の音声のフォーカス値より大きくするようにしてもよい。
また、テレビ100を視聴する視聴者の姿勢状態に応じて、番組の音声のフォーカス値を変化させてもよい。例えば、テレビ100に視聴者の視線を認識可能な視線認識センサが設けられているとする。例えば視線認識センサは既に実用化されているCCDセンサやCMOSセンサを使ったものを用いる。また視線認識ではないが、視聴状態の検出には、既に実用化されている赤外線センサを利用した人感センサを用いてもよい。このとき、フォーカス割合設定部122は、視線認識センサの検出結果をトリガー情報として、視聴者がテレビ100を見ていると判断される場合には番組のフォーカス値を大きくし、視聴者がテレビ100を見ていないと判断される場合には番組のフォーカス値を小さくする。なお、複数の番組が表示されている場合には、視聴者の視線の方向から視聴者が見ている番組を特定し、視聴者が見ていると特定した番組の音声のフォーカス値を他の番組の音声のフォーカス値より大きくするようにしてもよい。
視線認識センサの検出結果より、視聴者がテレビ100を見ていないと判断される場合には番組の音声のフォーカス値を徐々に下げるようにしてもよい。このとき、フォーカス割合設定部122は、フォーカス値の減少とともに画面を暗くしてもよい。これにより、テレビ100の消費電力を下げ、省エネルギでテレビ100を稼動させておくことができる。
[適用例6]
さらに、フォーカス割合設定部122は、テレビ100の周辺環境で発生した事件・事故等の緊急度に応じて、番組の音声のフォーカス値を変更してもよい。テレビ100の周辺環境は、テレビ100の位置情報に基づいて特定することができ、当該テレビ100を視聴するユーザのいる環境と同視できる。そこで、フォーカス割合設定部122は、ユーザのいる環境(テレビ100の位置情報)と、テレビ100より通知しようとしている情報との関連性を判断し、その関連の度合いに応じてフォーカス値を変更する。例えば地震発生を伝える緊急地震速報を通知する際、テレビ100の位置情報と地震発生位置との近さに応じて通知の緊急度を判定する。テレビ100の現在位置と地震発生位置とが近いほど通知の緊急度の高い情報となる。
さらに、フォーカス割合設定部122は、テレビ100の周辺環境で発生した事件・事故等の緊急度に応じて、番組の音声のフォーカス値を変更してもよい。テレビ100の周辺環境は、テレビ100の位置情報に基づいて特定することができ、当該テレビ100を視聴するユーザのいる環境と同視できる。そこで、フォーカス割合設定部122は、ユーザのいる環境(テレビ100の位置情報)と、テレビ100より通知しようとしている情報との関連性を判断し、その関連の度合いに応じてフォーカス値を変更する。例えば地震発生を伝える緊急地震速報を通知する際、テレビ100の位置情報と地震発生位置との近さに応じて通知の緊急度を判定する。テレビ100の現在位置と地震発生位置とが近いほど通知の緊急度の高い情報となる。
通知の緊急度が高い情報と判定した場合、視聴中の番組の音声と緊急地震速報の通知音とを混合して音声出力装置から出力するようにする。これにより、番組の音声を妨げることなく緊急地震速報の通知音を視聴者に確実に通知することができる。このとき、緊急地震速報の通知音のフォーカス値を大きくし、番組の音声のフォーカス値を下げるようにしてもよい。このように、フォーカス割合設定部122は、テレビ100(すなわち、ユーザ)の位置情報との関係により通知の緊急度の高い情報をトリガー情報として、複数の音声を混合して出力させることができる。
[適用例7]
また、テレビ100以外にも、例えば携帯電話機のような移動通信端末においても本実施形態の音声出力システムを適用することができる。例えば、携帯電話機において、話者の声と周囲の音(環境音)とを異なるマイクで集音し、これらの音声を周波数分割多重処理によって混合する。これにより、聞き手に対して話者の声および環境音のいずれもよく聞き取れるようにすることができ、聞き手の臨場感を高めることができる。このとき、話者の声を明確に聞き取れるようにするため、フォーカス割合設定部122は、話者の声のフォーカス値を大きくし、環境音のフォーカス値を小さくするようにしてもよい。このように音声の内容(種類)をトリガー情報として各音声のフォーカス値を設定することができる。
また、テレビ100以外にも、例えば携帯電話機のような移動通信端末においても本実施形態の音声出力システムを適用することができる。例えば、携帯電話機において、話者の声と周囲の音(環境音)とを異なるマイクで集音し、これらの音声を周波数分割多重処理によって混合する。これにより、聞き手に対して話者の声および環境音のいずれもよく聞き取れるようにすることができ、聞き手の臨場感を高めることができる。このとき、話者の声を明確に聞き取れるようにするため、フォーカス割合設定部122は、話者の声のフォーカス値を大きくし、環境音のフォーカス値を小さくするようにしてもよい。このように音声の内容(種類)をトリガー情報として各音声のフォーカス値を設定することができる。
[適用例8]
さらに、テレビ100にてインターネット電話サービスやオンラインゲームサービスを受ける場合、テレビ電話でチャットしたりオンラインゲームをしたりしながら同時にテレビ番組を視聴することもできる。例えば主表示エリアにテレビ電話の通話相手を表示し、副表示エリアにテレビ番組を表示する。このとき、テレビ電話の音声を明確に聞き取れるようにするため、フォーカス割合設定部122は、テレビ電話の音声のフォーカス値を大きくし、テレビ番組の音声のフォーカス値を小さくするようにしてもよい。このように音声の内容をトリガー情報として各音声のフォーカス値を設定することができる。
さらに、テレビ100にてインターネット電話サービスやオンラインゲームサービスを受ける場合、テレビ電話でチャットしたりオンラインゲームをしたりしながら同時にテレビ番組を視聴することもできる。例えば主表示エリアにテレビ電話の通話相手を表示し、副表示エリアにテレビ番組を表示する。このとき、テレビ電話の音声を明確に聞き取れるようにするため、フォーカス割合設定部122は、テレビ電話の音声のフォーカス値を大きくし、テレビ番組の音声のフォーカス値を小さくするようにしてもよい。このように音声の内容をトリガー情報として各音声のフォーカス値を設定することができる。
[適用例9]
また、ラジオチューナー搭載の携帯型音楽プレーヤーに対して本実施形態に係る音声出力システムを適用することもできる。例えば、音楽プレーヤーに予め記録された音楽を聴いているときにラジオで交通渋滞情報や天気予報番組が開始されると、音楽とラジオの音声とを両方出力するようにする。このとき、これらの音声に対して周波数分割多重処理を行うことで、いずれの音声も聞き取り可能となる。また、ラジオから出力される音声情報を明確に聞き取れるようにするため、フォーカス割合設定部122は、ラジオの音声のフォーカス値を大きくし、音楽のフォーカス値を小さくするようにしてもよい。このように音声の内容(種類)をトリガー情報として各音声のフォーカス値を設定することができる。
また、ラジオチューナー搭載の携帯型音楽プレーヤーに対して本実施形態に係る音声出力システムを適用することもできる。例えば、音楽プレーヤーに予め記録された音楽を聴いているときにラジオで交通渋滞情報や天気予報番組が開始されると、音楽とラジオの音声とを両方出力するようにする。このとき、これらの音声に対して周波数分割多重処理を行うことで、いずれの音声も聞き取り可能となる。また、ラジオから出力される音声情報を明確に聞き取れるようにするため、フォーカス割合設定部122は、ラジオの音声のフォーカス値を大きくし、音楽のフォーカス値を小さくするようにしてもよい。このように音声の内容(種類)をトリガー情報として各音声のフォーカス値を設定することができる。
[適用例10]
さらに、テレビ100の主音声と副音声を同時に出力する際に、本実施形態に係る音声出力システムを適用することもできる。これにより、主音声および副音声を同時に聞き取り易くすることができる。また、英語と日本語のように異なる2つの言語が主音声と副音声とで出力されている場合には、両言語を同時に聞けるので外国語の学習にも役立つ。この場合、フォーカス割合設定部122は、例えば主音声のフォーカス値を大きくし、副音声のフォーカス値を小さくするようにしてもよい。このように音声の内容(種類)をトリガー情報として各音声のフォーカス値を設定することができる。
さらに、テレビ100の主音声と副音声を同時に出力する際に、本実施形態に係る音声出力システムを適用することもできる。これにより、主音声および副音声を同時に聞き取り易くすることができる。また、英語と日本語のように異なる2つの言語が主音声と副音声とで出力されている場合には、両言語を同時に聞けるので外国語の学習にも役立つ。この場合、フォーカス割合設定部122は、例えば主音声のフォーカス値を大きくし、副音声のフォーカス値を小さくするようにしてもよい。このように音声の内容(種類)をトリガー情報として各音声のフォーカス値を設定することができる。
[適用例11]
また、テレビ100にて複数の番組が視聴されているとき、視聴されている番組の内容に応じて各番組の音声のフォーカス値を自動的に変更してもよい。例えば、ニュース番組であれば、アナウンサーの声が聞き取れることが重要である。一方、野球やサッカー等のスポーツでは、試合映像や臨場感が重要となる。そこで、例えばスポーツ番組とニュース番組とが同時に視聴されるときには、フォーカス割合設定部122は、ニュース番組の音声のフォーカス値を大きくする。このように音声の内容(種類)をトリガー情報として各音声のフォーカス値を設定することができる。
また、テレビ100にて複数の番組が視聴されているとき、視聴されている番組の内容に応じて各番組の音声のフォーカス値を自動的に変更してもよい。例えば、ニュース番組であれば、アナウンサーの声が聞き取れることが重要である。一方、野球やサッカー等のスポーツでは、試合映像や臨場感が重要となる。そこで、例えばスポーツ番組とニュース番組とが同時に視聴されるときには、フォーカス割合設定部122は、ニュース番組の音声のフォーカス値を大きくする。このように音声の内容(種類)をトリガー情報として各音声のフォーカス値を設定することができる。
さらに、人の声は約1〜5kHzの周波数帯域にあるため、音声処理装置125は、周波数分割多重処理においてこの周波数帯域をニュース番組の音声に優先的に割り当てるようにする。これにより、よりアナウンサーの声を聞き取り易くすることができる。一方、スポーツ番組においては低音域が重要であるため、音声処理装置125は、例えば約20〜500Hzの周波数帯域をスポーツ番組の音声に優先的に割り当てるようにする。なお、音楽番組等においては高音域の周波数帯域を優先的に割り当てるとよい。また、同じジャンルの番組に対しては、均一に周波数帯域を割り当てるようにしてもよい。このように、周波数帯域に応じてフォーカス値を設定することで、コンテンツに適した音声をより明確に提供することができる。
[適用例12]
カーナビゲーションシステムにおいても、交通情報の提供と同時に音楽やテレビ番組を提供することが可能である。ここで、カーナビゲーションシステムにより音楽を聴いているとき、渋滞情報や道路工事情報等の割り込みを、本実施形態に係る音声出力システムを用いて行うことで、音楽の再生を停止することなく割り込み情報を合成した音声で出力することが可能となる。このとき、割り込み情報は重要度の高い情報と考えられるため、フォーカス割合設定部122は、音楽のフォーカス値を小さくし、割り込み情報の合成音声のフォーカス値を大きくすることにより、割り込み情報を聞き取り易くすることができる。このように音声の内容(種類)をトリガー情報として各音声のフォーカス値を設定することができる。
カーナビゲーションシステムにおいても、交通情報の提供と同時に音楽やテレビ番組を提供することが可能である。ここで、カーナビゲーションシステムにより音楽を聴いているとき、渋滞情報や道路工事情報等の割り込みを、本実施形態に係る音声出力システムを用いて行うことで、音楽の再生を停止することなく割り込み情報を合成した音声で出力することが可能となる。このとき、割り込み情報は重要度の高い情報と考えられるため、フォーカス割合設定部122は、音楽のフォーカス値を小さくし、割り込み情報の合成音声のフォーカス値を大きくすることにより、割り込み情報を聞き取り易くすることができる。このように音声の内容(種類)をトリガー情報として各音声のフォーカス値を設定することができる。
以上の適用例は、それぞれ独立して実行することも可能であり、2以上のトリガー情報を組み合わせて実行することも可能である。
以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
例えば、上記実施形態では、主としてテレビ100およびリモコン200に音声出力システムを適用した場合について説明したが、本技術はかかる例に限定されない。例えば、図10に示すようなタブレット型デバイスに300に適用してもよい。タブレット型デバイス300では、例えばデバイス300の表示部310に、テレビ番組を表示する表示エリア312、314と、テレビ番組を選択するためのテレビ番組動画リスト320とを表示させることができる。表示部310にはタッチセンサが対応して設けられており、表示部310の表示面に対して指やタッチペン等の操作体を接触させたり移動させたりすることで、表示内容を操作できる。
ユーザは、テレビ番組動画リスト320から視聴したいテレビ番組のアイコン321を選択し、任意の表示エリアにドラッグすることでその表示エリアに選択したテレビ番組を表示させることができる。各表示エリア312、314には、図1と同様、2つの表示エリア312、314に表示されているテレビ番組の音声のフォーカス値をそれぞれ表示させることができる。
タブレット型デバイス300では、例えば任意の表示エリアにおいて、近接する2本の指を離隔するピンチアウト操作を行うと、当該表示エリアに表示されているテレビ番組の音声のフォーカス値を大きくすることができる。このとき、他方の表示エリアに表示されているテレビ番組の音声のフォーカス値を、一方のテレビ番組のフォーカス値が大きくされた分だけ自動的に小さくするようにしてもよい。また、例えば任意の表示エリアにおいて、離隔している2本の指を近接するピンチイン操作を行うと、当該表示エリアに表示されているテレビ番組の音声のフォーカス値を小さくすることができる。このとき、他方の表示エリアに表示されているテレビ番組の音声のフォーカス値を、一方のテレビ番組のフォーカス値が小さくされた分だけ自動的に大きくするようにしてもよい。
このように、音声のフォーカス値は、図2に示したようなフォーカス割合変更部を用いなくとも、例えばジェスチャ入力等によって設定、変更することができる。
また、本実施形態では、リモコン200にフォーカス割合変更スライダー230等のフォーカス値を調節する音声調節部を設けたが、本技術はかかる例に限定されない。例えば音声調節部がソフトウェア入力部として提供されるとき、ネットワークを介して、各音声データのフォーカス値をそれぞれ調節可能な音声調節部を表示部に表示させるプログラムを提供するようにしてもよい。この場合、プログラムの提供を受けた機器においてプログラムが実行され、表示部に音声調節部を表示させる。あるいは、ネットワークを介して接続されたサーバ上で当該プログラムを実行させ、実行結果を受けた機器が、実行結果に基づいて表示部に音声調節部を表示させることもできる。
なお、以下のような構成も本開示の技術的範囲に属する。
(1)
同時に出力される複数の音声データに関連するトリガー情報に基づいて、前記各音声データの強調の度合いを示すフォーカス値の割合を設定するフォーカス割合設定部と、
前記設定されたフォーカス値で前記各音声データを合成する音声処理部と、
を備える、情報処理装置。
(2)
前記フォーカス割合設定部は、前記トリガー情報としてユーザにより設定された前記フォーカス値の割合の変更情報に基づいて、出力される前記各音声データの前記フォーカス値の割合を設定する、前記(1)に記載の情報処理装置。
(3)
前記フォーカス割合設定部は、前記トリガー情報として前記音声データの内容に関する情報に基づいて、出力される前記各音声データの前記フォーカス値の割合を設定する、前記(1)または(2)に記載の情報処理装置。
(4)
前記フォーカス割合設定部は、前記トリガー情報として、前記音声データが出力される環境と出力される前記音声データとの関連性に基づいて、出力される前記各音声データの前記フォーカス値の割合を設定する、前記(1)〜(3)のいずれか1項に記載の情報処理装置。
(5)
前記フォーカス割合設定部は、前記トリガー情報として前記音声データの提供を受けるユーザの姿勢状態に基づいて、出力される前記各音声データの前記フォーカス値の割合を設定する、前記(1)〜(4)のいずれか1項に記載の情報処理装置。
(6)
前記音声処理部は、
周波数帯域を分割して生成された複数の分割帯域に対して、前記各音声データの内容に応じて当該音声データを割り当て、
前記各分割帯域に割り当てられた前記各音声データを合成する、前記(1)〜(5)のいずれか1項に記載の情報処理装置。
(7)
前記各音声データに対応する画像データが表示部に表示されるとき、前記フォーカス割合設定部は、前記画像データを表示する表示エリアの大きさに基づいて、前記音声データのフォーカス値を設定する、前記(1)〜(6)のいずれか1項に記載の情報処理装置。
(1)
同時に出力される複数の音声データに関連するトリガー情報に基づいて、前記各音声データの強調の度合いを示すフォーカス値の割合を設定するフォーカス割合設定部と、
前記設定されたフォーカス値で前記各音声データを合成する音声処理部と、
を備える、情報処理装置。
(2)
前記フォーカス割合設定部は、前記トリガー情報としてユーザにより設定された前記フォーカス値の割合の変更情報に基づいて、出力される前記各音声データの前記フォーカス値の割合を設定する、前記(1)に記載の情報処理装置。
(3)
前記フォーカス割合設定部は、前記トリガー情報として前記音声データの内容に関する情報に基づいて、出力される前記各音声データの前記フォーカス値の割合を設定する、前記(1)または(2)に記載の情報処理装置。
(4)
前記フォーカス割合設定部は、前記トリガー情報として、前記音声データが出力される環境と出力される前記音声データとの関連性に基づいて、出力される前記各音声データの前記フォーカス値の割合を設定する、前記(1)〜(3)のいずれか1項に記載の情報処理装置。
(5)
前記フォーカス割合設定部は、前記トリガー情報として前記音声データの提供を受けるユーザの姿勢状態に基づいて、出力される前記各音声データの前記フォーカス値の割合を設定する、前記(1)〜(4)のいずれか1項に記載の情報処理装置。
(6)
前記音声処理部は、
周波数帯域を分割して生成された複数の分割帯域に対して、前記各音声データの内容に応じて当該音声データを割り当て、
前記各分割帯域に割り当てられた前記各音声データを合成する、前記(1)〜(5)のいずれか1項に記載の情報処理装置。
(7)
前記各音声データに対応する画像データが表示部に表示されるとき、前記フォーカス割合設定部は、前記画像データを表示する表示エリアの大きさに基づいて、前記音声データのフォーカス値を設定する、前記(1)〜(6)のいずれか1項に記載の情報処理装置。
100 テレビ
101、201 CPU
102、202 ROM
103、203 RAM
104 受信装置
105 外部記憶装置/デコード回路
106、205 通信装置
107 画像/音声出力装置
110 表示部
112、114 表示エリア
116、118 表示されたフォーカス値
121 パラメータ取得部
122 フォーカス割合設定部
123 画像サイズ変更装置
124 画像ミキサー装置
125 音声処理装置
126 音声ミキサー装置
200 リモコン
204 ユーザインタフェース
206 表示装置
210、220 選局ボタン
230 フォーカス割合変更スライダー
232 スライド部
240 通信部
300 タブレット型デバイス
101、201 CPU
102、202 ROM
103、203 RAM
104 受信装置
105 外部記憶装置/デコード回路
106、205 通信装置
107 画像/音声出力装置
110 表示部
112、114 表示エリア
116、118 表示されたフォーカス値
121 パラメータ取得部
122 フォーカス割合設定部
123 画像サイズ変更装置
124 画像ミキサー装置
125 音声処理装置
126 音声ミキサー装置
200 リモコン
204 ユーザインタフェース
206 表示装置
210、220 選局ボタン
230 フォーカス割合変更スライダー
232 スライド部
240 通信部
300 タブレット型デバイス
Claims (9)
- 同時に出力される複数の音声データに関連するトリガー情報に基づいて、前記各音声データの強調の度合いを示すフォーカス値の割合を設定するフォーカス割合設定部と、
前記設定されたフォーカス値で前記各音声データを合成する音声処理部と、
を備える、情報処理装置。 - 前記フォーカス割合設定部は、前記トリガー情報としてユーザにより設定された前記フォーカス値の割合の変更情報に基づいて、出力される前記各音声データの前記フォーカス値の割合を設定する、請求項1に記載の情報処理装置。
- 前記フォーカス割合設定部は、前記トリガー情報として前記音声データの内容に関する情報に基づいて、出力される前記各音声データの前記フォーカス値の割合を設定する、請求項1に記載の情報処理装置。
- 前記フォーカス割合設定部は、前記トリガー情報として、前記音声データが出力される環境と出力される前記音声データとの関連性に基づいて、出力される前記各音声データの前記フォーカス値の割合を設定する、請求項1に記載の情報処理装置。
- 前記フォーカス割合設定部は、前記トリガー情報として前記音声データの提供を受けるユーザの姿勢状態に基づいて、出力される前記各音声データの前記フォーカス値の割合を設定する、請求項1に記載の情報処理装置。
- 前記音声処理部は、
周波数帯域を分割して生成された複数の分割帯域に対して、前記各音声データの内容に応じて当該音声データを割り当て、
前記各分割帯域に割り当てられた前記各音声データを合成する、請求項1に記載の情報処理装置。 - 前記各音声データに対応する画像データが表示部に表示されるとき、前記フォーカス割合設定部は、前記画像データを表示する表示エリアの大きさに基づいて、前記音声データのフォーカス値を設定する、請求項1に記載の情報処理装置。
- 同時に出力される複数の音声データに関連するトリガー情報に基づいて、前記各音声データの強調の度合いを示すフォーカス値の割合を設定するステップと、
前記設定されたフォーカス値で前記各音声データを合成するステップと、
を含む、情報処理方法。 - コンピュータを、
同時に出力される複数の音声データに関連するトリガー情報に基づいて、前記各音声データの強調の度合いを示すフォーカス値の割合を設定するフォーカス割合設定部と、
前記設定されたフォーカス値で前記各音声データを合成する音声処理部と、
を備える、情報処理装置として機能させるコンピュータプログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011199227A JP2013062652A (ja) | 2011-09-13 | 2011-09-13 | 情報処理装置、情報処理方法およびコンピュータプログラム |
EP12177530.8A EP2571280A3 (en) | 2011-09-13 | 2012-07-23 | Information processing device and computer program |
US13/562,545 US8908110B2 (en) | 2011-09-13 | 2012-07-31 | Information processing device and computer program |
CN2012103280043A CN103002347A (zh) | 2011-09-13 | 2012-09-06 | 信息处理装置、信息处理方法和计算机程序 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011199227A JP2013062652A (ja) | 2011-09-13 | 2011-09-13 | 情報処理装置、情報処理方法およびコンピュータプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2013062652A true JP2013062652A (ja) | 2013-04-04 |
Family
ID=48186962
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011199227A Withdrawn JP2013062652A (ja) | 2011-09-13 | 2011-09-13 | 情報処理装置、情報処理方法およびコンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2013062652A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016152574A (ja) * | 2015-02-19 | 2016-08-22 | 株式会社アステム | 番組出力装置、番組と補助情報の出力方法、およびプログラム |
JP2022062179A (ja) * | 2020-09-28 | 2022-04-19 | グリー株式会社 | コンピュータプログラム、方法及びサーバ装置 |
-
2011
- 2011-09-13 JP JP2011199227A patent/JP2013062652A/ja not_active Withdrawn
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016152574A (ja) * | 2015-02-19 | 2016-08-22 | 株式会社アステム | 番組出力装置、番組と補助情報の出力方法、およびプログラム |
JP2022062179A (ja) * | 2020-09-28 | 2022-04-19 | グリー株式会社 | コンピュータプログラム、方法及びサーバ装置 |
JP7376029B2 (ja) | 2020-09-28 | 2023-11-08 | グリー株式会社 | コンピュータプログラム、方法及びサーバ装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8908110B2 (en) | Information processing device and computer program | |
US20090089675A1 (en) | Method for providing graphical user interface and video apparatus using the same | |
JP2008054065A (ja) | 情報処理装置及びその制御方法 | |
JP2007013725A (ja) | 映像表示装置及び映像表示方法 | |
JP2006141030A (ja) | デジタル放送受信機におけるチャネル切替時の情報出力方法 | |
KR102254894B1 (ko) | 음성 인식 검색 결과를 이용하여 카테고리를 배열하는 디스플레이 디바이스 및 그 제어 방법 | |
JP2007311942A (ja) | コンテンツ表示装置 | |
JP2010200085A (ja) | 映像機器 | |
KR20150005131A (ko) | 영상표시장치 및 영상표시장치 동작방법 | |
CN101647272A (zh) | 用于接收广播信号的设备及使用该设备处理广播信号的方法 | |
JPWO2009037829A1 (ja) | 表示装置、表示方法および表示プログラム | |
JP2013062652A (ja) | 情報処理装置、情報処理方法およびコンピュータプログラム | |
JP5884348B2 (ja) | 情報処理装置およびコンピュータプログラム | |
JP2006319680A (ja) | テレビシステム、携帯端末、tvチューナー、携帯端末で動作するプログラム、及びtvチューナーで動作するプログラム | |
JP2010200087A (ja) | 映像機器 | |
JP5551186B2 (ja) | 放送受信装置及び放送受信装置における番組情報音声出力方法 | |
JP2009112049A (ja) | 情報処理装置及びその制御方法 | |
CN113542829A (zh) | 分屏显示方法、显示终端及可读存储介质 | |
KR101798961B1 (ko) | 방송신호 수신기 및 그의 구동방법 | |
KR20160148173A (ko) | 디스플레이 디바이스 및 그 제어 방법 | |
WO2020129695A1 (ja) | 情報処理装置、制御方法、情報処理端末、情報処理方法 | |
WO2012070534A1 (ja) | 映像音声出力装置、および映像音声出力方法、ならびに該映像音声出力装置を備えたテレビジョン受像機 | |
KR101811398B1 (ko) | 방송신호 수신기 및 그의 구동방법 | |
KR101798962B1 (ko) | 방송신호 수신기 및 그의 구동방법 | |
KR20120104470A (ko) | 방송신호 수신기 및 그의 구동방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20141202 |