<第1実施の形態>
[信号処理システムの第1実施の形態の概要の説明]
図1および図2は、本技術を適用した信号処理システムの第1実施の形態の概要を説明する図である。
図1に示すように、信号処理システム10は、信号処理装置11と信号処理装置12により構成される。
信号処理装置11と信号処理装置12は、ビデオカメラ等により構成される。信号処理装置11と信号処理装置12は、それぞれ、同一のイベントの異なる動画像を撮影し、音響を取得する。図1の例では、同一のイベントがランニングしている女性である。また、信号処理装置11は、そのイベントを左方向から撮影して音響を取得し、信号処理装置12は、そのイベントを右方向から撮影して音響を取得している。
このようにして得られた動画像と音響のコンテンツは、それぞれ、そのコンテンツが得られた信号処理装置11または信号処理装置12に記憶される。なお、この2つのコンテンツは、同一のイベントのコンテンツであるが、撮影開始時刻等が異なることにより、基本的には、時間的な同期がとれていない。従って、この2つのコンテンツを同時に再生する場合、時間的な同期をとる必要がある。
信号処理装置11のユーザは、2つのコンテンツを同時に再生する場合、図2に示すように、例えば、信号処理装置11に表示される再生ボタン21、一時停止ボタン22、再生位置スクロール23、エフェクトボタン24などを操作する。
再生ボタン21は、再生の開始を指令するときに操作されるボタンである。ユーザにより再生ボタン21が操作されると、信号処理装置11は、信号処理装置11における再生対象のコンテンツAの再生を開始する。また、信号処理装置11は、コンテンツAの再生開始位置に対応する、信号処理装置12における再生対象のコンテンツBの位置を再生の開始位置として示す再生開始制御情報を信号処理装置12に送信する。これにより、信号処理装置12は、コンテンツAの再生開始位置の時間的な同期位置からコンテンツBの再生を開始することができる。
そして、コンテンツAとコンテンツBの再生中には、信号処理装置12は、コンテンツBの再生位置を信号処理装置11に送信する。信号処理装置11は、コンテンツBの再生位置を信号処理装置12から受信し、コンテンツAとコンテンツBの再生位置に基づいて、コンテンツAとコンテンツBの同期のずれが閾値以上であるかどうかを判定する。信号処理装置11は、コンテンツAとコンテンツBの同期のずれが閾値以上であると判定された場合、コンテンツAとコンテンツBが同期するようにコンテンツAの再生位置を変更する。
一時停止ボタン22は、再生の一時停止を指令するときに操作されるボタンである。ユーザにより一時停止ボタン22が操作されると、信号処理装置11は、コンテンツAの再生を一時停止する。また、信号処理装置11は、再生の一時停止時のコンテンツAの再生位置に対応するコンテンツBの位置を再生の一時停止位置として示す再生一時停止制御情報を信号処理装置12に送信する。これにより、信号処理装置12は、コンテンツAの再生一時停止位置の時間的な同期位置で、コンテンツBの再生を一時停止することができる。
再生位置スクロール23は、再生位置を変更するときに操作されるスクロールである。ユーザにより再生位置スクロール23が操作されると、信号処理装置11は、コンテンツAの再生位置を変更する。また、信号処理装置11は、コンテンツAの変更後の再生位置に対応するコンテンツBの位置を再生の変更位置として示す再生位置変更制御情報を信号処理装置12に送信する。これにより、信号処理装置12は、コンテンツBの再生位置を、コンテンツAの変更後の再生位置の時間的な同期位置に変更することができる。
エフェクトボタン24は、再生中のコンテンツにエフェクトを施すときに操作されるボタンである。ユーザによりエフェクトボタン24が操作されると、信号処理装置11は、再生中のコンテンツAにエフェクトを施す。また、信号処理装置11は、コンテンツAのエフェクトが施された位置に対応するコンテンツBの位置を、エフェクトを施す位置として示すエフェクト制御情報を信号処理装置12に送信する。これにより、信号処理装置12は、コンテンツAのエフェクトが施された位置の時間的な同期位置のコンテンツBにエフェクトを施すことができる。その結果、よりエンターテイメント性の高い再生を行うことができる。
なお、ここでは、エフェクトボタン24がエフェクトを施すときに操作されるものとしたが、エフェクトボタン24は、エフェクトを開始および終了するときに操作されるものとしてもよい。この場合、エフェクトボタン24が操作されてから次に操作されるまでの間コンテンツAにエフェクトが施され、コンテンツAのエフェクトが施された区間に対応するコンテンツBの区間にエフェクトが施される。
また、エフェクトは、コンテンツの音響データまたは画像データのいずれか一方に施されてもよいし、両方に施されてもよい。画像データに対するエフェクトとしては、コントラストの変更、テロップの付加、所定の静止画像の重ね合わせ、ぼかし、モザイク、炎や雷などの画像の付加、色反転、ワイプインやワイプアウト、フェードインやフェードアウト、モノクロ化などがある。音響データに対するエフェクトとしては、エコーの付加、残響の付加などがある。
さらに、実際には、信号処理装置12にも、再生ボタン21、一時停止ボタン22、再生位置スクロール23、およびエフェクトボタン24が表示され、操作されるが、ここでは、説明の便宜上、これらのボタンが信号処理装置11においてのみ操作されるものとする。
[信号処理装置11の構成例]
図3は、図2の信号処理装置11の構成例を示すブロック図である。
図3の信号処理装置11は、取得部40、記憶部41、受付部42、ファイル選択部43、特徴量算出部44、特徴量受信部45、同期情報生成部46、制御情報生成部47、制御情報送信部48、再生部49、出力部50、再生位置受信部51、および要求部52により構成される。
取得部40は、CCD(Charge Coupled Device)カメラとマイク等により構成される。取得部40は、受付部42からの指令に応じて、被写体を撮影し、音響を取得する。取得部40は、その結果得られる動画像と音響のコンテンツを記憶部41に供給する。
記憶部41は、取得部40から供給されるコンテンツをファイルとして記憶する。
受付部42は、ユーザからの指令を受け付ける。具体的には、受付部42は、ユーザからの撮影開始の指令を受け付け、その指令を取得部40に供給する。また、受付部42は、ユーザからの再生対象とするコンテンツAのファイルの指令を受け付け、そのファイルを再生対象のファイルとしてファイル選択部43と要求部52に通知する。さらに、受付部42は、ユーザが、再生ボタン21、一時停止ボタン22、再生位置スクロール23、またはエフェクトボタン24を操作することにより行う指令を受け付け、その指令を制御情報生成部47、再生部49、および要求部52に供給する。
ファイル選択部43は、受付部42からの通知にしたがって、記憶部41から再生対象のファイルのコンテンツAを読み出し、特徴量算出部44と再生部49に供給する。
特徴量算出部44は、ファイル選択部43から供給されるコンテンツAのうちの音響データに基づいて特徴量の時系列データを算出し、同期情報生成部46に供給する。
特徴量受信部45は、信号処理装置12から送信されてくるコンテンツBの特徴量の時系列データを受信し、同期情報生成部46に供給する。
同期情報生成部46は、特徴量算出部44からのコンテンツAの特徴量の時系列データと、特徴量受信部45からのコンテンツBの特徴量の時系列データに基づいて、コンテンツAとコンテンツBを同期する際に用いられる同期情報を生成する。同期情報生成部46は、同期情報を制御情報生成部47と再生部49に供給する。
制御情報生成部47は、同期情報生成部46から供給される同期情報、受付部42から供給される指令等に基づいて、コンテンツBに対する制御情報を生成する。具体的には、制御情報生成部47は、同期情報と再生ボタン21の操作に対応する指令とに基づいて、再生開始制御情報を生成する。また、制御情報生成部47は、同期情報、一時停止ボタン22の操作に対応する指令、および再生部49から供給される一時停止位置に基づいて、再生一時停止制御情報を生成する。
制御情報生成部47は、同期情報、再生位置スクロール23の操作に対応する指令、および再生部49から供給される変更後の再生位置に基づいて、再生位置変更制御情報を生成する。制御情報生成部47は、同期情報、エフェクトボタン24の操作に対応する指令、および再生部49から供給される再生位置に基づいて、エフェクト制御情報を生成する。
制御情報生成部47は、生成された再生開始制御情報、再生一時停止制御情報、再生位置変更制御情報、またはエフェクト制御情報を制御情報送信部48に供給する。
制御情報送信部48は、制御情報生成部47から供給される再生開始制御情報、再生一時停止制御情報、再生位置変更制御情報、またはエフェクト制御情報を信号処理装置12に送信する。
再生部49は、受付部42から供給される指令に基づいて、ファイル選択部43から供給されるコンテンツAの再生を制御する。具体的には、再生部49は、再生ボタン21の操作に対応する指令に基づいて、コンテンツAの再生処理を開始し、その結果得られるコンテンツAの音響データと動画像データを出力部50に供給する。ここで、再生処理とは、例えば、コンテンツAの音響データと動画像データを分離する処理等である。なお、コンテンツAがエンコードされて記憶されている場合、再生処理としてデコード処理も行われる。
また、再生部49は、一時停止ボタン22の操作に対応する指令に基づいて、コンテンツAの再生処理を一時停止し、一時停止位置を制御情報生成部47に供給する。再生部49は、再生位置スクロール23の操作に対応する指令に基づいて、コンテンツAの再生処理における再生位置を変更し、変更後の再生位置を制御情報生成部47に供給する。再生部49は、エフェクトボタン24の操作に対応する指令に基づいて、再生中のコンテンツAに対してエフェクトを施し、エフェクトが施されたコンテンツAの音響データと動画像データを出力部50に供給する。また、再生部49は、エフェクトを施したときの再生位置を制御情報生成部47に供給する。
さらに、再生部49は、コンテンツAの再生位置、再生位置受信部51から供給されるコンテンツBの再生位置、および同期情報生成部46から供給される同期情報に基づいて、コンテンツAとコンテンツBの同期のずれ量を計算する。再生部49は、ずれ量が所定の閾値以上である場合、コンテンツAの再生位置、コンテンツBの再生位置、および同期情報に基づいて、コンテンツAとコンテンツBが同期するように、コンテンツAの再生処理における再生位置を変更する。
出力部50は、ディスプレイとスピーカ等により構成される。出力部50のスピーカは、再生部49から供給される音響データに対応する音響を出力する。また、出力部50のディスプレイは、再生部49から供給される動画像データに基づいて動画像を表示する。
再生位置受信部51は、要求部52による要求に応じて信号処理装置12から送信されてくるコンテンツBの再生位置を受信し、再生部49に供給する。
要求部52は、受付部42から供給される指令に基づいて、コンテンツAの再生中に、信号処理装置12にコンテンツBの再生位置を要求する。また、要求部52は、受付部42から供給される通知に応じて、コンテンツBの特徴量の時系列データを信号処理装置12に要求する。
なお、信号処理装置11と信号処理装置12の間の通信には、Wi-FiやBluetooth(登録商標)などを用いた無線通信、または有線通信を用いることができる。
[信号処理装置12の構成例]
図4は、図2の信号処理装置12の構成例を示すブロック図である。
図4の信号処理装置12は、取得部70、記憶部71、受付部72、ファイル選択部73、特徴量算出部74、特徴量送信部75、制御情報受信部76、再生部77、出力部78、再生位置取得部79、および再生位置送信部80により構成される。
取得部70は、CCDカメラとマイク等により構成される。取得部70は、受付部72からの指令に応じて、被写体を撮影し、音響を取得する。取得部70は、その結果得られる動画像と音響のコンテンツを記憶部71に供給する。
記憶部71は、取得部70から供給されるコンテンツをファイルとして記憶する。
受付部72は、ユーザからの指令を受け付ける。具体的には、受付部72は、ユーザからの撮影開始の指令を受け付け、その指令を取得部70に供給する。また、受付部72は、ユーザからの再生対象とするコンテンツBのファイルの指令を受け付け、そのファイルを再生対象のファイルとしてファイル選択部73に通知する。
ファイル選択部73は、受付部72からの通知にしたがって、記憶部71から再生対象のファイルのコンテンツBを読み出し、特徴量算出部74と再生部77に供給する。
特徴量算出部74は、信号処理装置11の要求部52(図3)からの要求に応じて、ファイル選択部73から供給されるコンテンツBのうちの音響データに基づいて特徴量の時系列データを算出し、特徴量送信部75に供給する。
特徴量送信部75は、特徴量算出部74から供給される特徴量の時系列データを信号処理装置11に送信する。
制御情報受信部76は、信号処理装置11の制御情報送信部48(図3)から送信されてくる、再生開始制御情報、再生一時停止制御情報、再生位置変更制御情報、またはエフェクト制御情報を受信し、再生部77に供給する。
再生部77は、制御情報受信部76から供給される再生開始制御情報、再生一時停止制御情報、再生位置変更制御情報、またはエフェクト制御情報にしたがって、ファイル選択部73から供給されるコンテンツBの再生を制御する。
具体的には、再生部77は、再生開始制御情報にしたがって、再生開始制御情報が示す再生の開始位置からコンテンツBの再生処理を開始し、その結果得られるコンテンツBの音響データと動画像データを出力部78に供給する。再生部77は、再生一時停止制御情報にしたがって、再生一時停止制御情報が示す再生の一時停止位置でコンテンツBの再生処理を一時停止する。
また、再生部77は、再生位置変更制御情報にしたがって、再生位置変更制御情報が示す再生の変更位置に、コンテンツBの再生処理における再生位置を変更する。再生部77は、エフェクト制御情報にしたがって、エフェクト制御情報が示すエフェクトを施す位置の再生処理後のコンテンツBにエフェクトを施し、エフェクトが施されたコンテンツBの音響データと動画像データを出力部78に供給する。
出力部78は、ディスプレイとスピーカ等により構成される。出力部78のスピーカは、再生部77から供給される音響データに対応する音響を出力する。また、出力部78のディスプレイは、再生部77から供給される動画像データに基づいて動画像を表示する。
再生位置取得部79は、図3の要求部52からの要求に応じて、再生部77により再生中のコンテンツBの位置を取得し、コンテンツBの再生位置として再生位置送信部80に供給する。
再生位置送信部80は、再生位置取得部79から供給されるコンテンツBの再生位置を信号処理装置11に送信する。
[特徴量算出部の構成例]
図5は、図3の特徴量算出部44の構成例を示すブロック図である。なお、図示は省略するが、図4の特徴量算出部74も、図5の特徴量算出部44と同様に構成される。
図5の特徴量算出部44は、周波数帯域分割部101、周期性検出部102−1乃至102−4、周期性強度検出部103−1乃至103−4、周期性情報統合部104、およびピーク検出部105により構成される。
周波数帯域分割部101は、図3のファイル選択部43から供給されるコンテンツAのうちの音響データを、窓関数を用いて、数10msec乃至100msec程度の時間区間に分割する。周波数帯域分割部101は、複数のバンドパスフィルタを用いて、時間区間ごとの音響データを4つの周波数帯域に分割する。周波数帯域分割部101は、各周波数帯域の音響データを、周期性検出部102−1乃至102−4のそれぞれに供給する。
なお、ここでは、周波数帯域分割部101が音響データを4つの周波数帯域に分割するものとするが、分割数は4に限定されないし、音響データは帯域分割されなくてもよい。また、バンドパスフィルタとしては、例えばオクターブバンドフィルタなどの、高い周波数ほど通過周波数帯域幅が広くなるフィルタを用いると効果的である。
周期性検出部102−1乃至102−4は、それぞれ、周波数帯域分割部101から供給される所定の周波数帯域の時間区間ごとの音響データの自己相関関数を計算することにより、時間区間ごとの周期性情報を抽出する。
なお、ここでは、周期性情報として、インデックスがbである周波数帯域の、インデックスがτである時間遅れの音響データの自己相関関数x(b,τ)そのものを用いるが、自己相関関数x(b,τ)をx(b,0)で除算した値を用いることもできる。また、自己相関関数x(b,τ)の計算方法としては、所定の周波数帯域の音響データに対して離散フーリエ変換を行うことにより得られるスペクトルのピークを用いた方法などを用いることができる。
周期性検出部102−1乃至102−4は、それぞれ、抽出された時間区間ごとの周期性情報を周期性強度検出部103−1乃至103−4と周期性情報統合部104に供給する。なお、以下では、周期性検出部102−1乃至102−4を特に区別する必要がない場合、それらをまとめて周期性検出部102という。
周期性強度検出部103−1乃至103−4は、それぞれ、周期性検出部102−1乃至102−4から供給される時間区間ごとの周期性情報に基づいて、時間区間ごとの周期性の強度を計算する。具体的には、τ=0近傍以外のτにおける周期性情報である自己相関関数x(b, τ)の最大値が周期性の強度として計算される。この周期性の強度が大きいほど、処理対象の音響データの周期性が強く、周期性の強度が小さいほど、処理対象の音響データの周期性がノイズらしくなる。
そして、周期性強度検出部103−1乃至103−4は、それぞれ、時間区間ごとの周期性の強度を、閾値を超えたかどうかで2値化し、時間区間ごとの周期性強度情報とする。即ち、時間区間ごとに、周期性の強度が所定の閾値を超えた場合、周期性強度情報は1とされ、周期性の強度が所定の閾値以下である場合、周期性強度情報は0とされる。周期性強度検出部103−1乃至103−4は、それぞれ、時間区間ごとの周期性強度情報を周期性情報統合部104に供給する。
なお、周期性強度検出部103−1乃至103−4を特に区別する必要がない場合、それらをまとめて周期性強度検出部103という。
周期性情報統合部104は、周期性検出部102から供給される時間区間ごとの周期性情報と、周期性強度検出部103から供給される時間区間ごとの周期性強度情報とに基づいて、時間区間ごとの周期性情報を統合する周期性統合処理を行う。具体的には、周期性情報統合部104は、以下の式(1)を用いて時間区間ごとに周期性情報である自己相関関数x(b,τ)の総和を求める。
なお、式(1)において、Nbは周波数帯域の総数を表し、p(b)は周期性強度情報を表す。また、Npは周期性強度情報p(b)が1となる周波数帯域の数を表す。
周期性情報統合部104は、周期性統合処理の結果得られる時間区間ごとの周期性情報の総和S(τ)をピーク検出部105に供給する。
ピーク検出部105は、時間区間ごとに、周期性情報統合部104から供給される周期性情報の総和S(τ)に対してピーク検出を行い、ピーク位置τpの値が1となり、ピーク位置τp以外の値が0となるピーク情報P(τ)を生成する。ピーク検出方法としては、例えば、周期性情報の総和S(τ)の微分値が正から負に変わるときのインデックスτを、ピーク位置τpとして検出する方法がある。
なお、ピーク検出部105は、ピーク位置τpの周期性情報の総和S(τp)が、所定の閾値より小さい場合、そのピーク位置τpのピーク情報P(τp)を0とするようにしてもよい。これにより、ピーク情報P(τp)のノイズを低減することができる。また、ピーク情報は、周期性情報の総和S(τ)そのものであってもよい。
ピーク検出部105は、時間区間ごとのピーク情報P(τ)を、時間区間ごとの特徴量の時系列データとして図3の同期情報生成部46に供給する。
[特徴量の時系列データの例]
図6は、特徴量の時系列データの例を示す図である。
なお、図6のグラフにおいて、横軸は、先頭からの時間区間の個数である時間区間番号を表し、縦軸はインデックスτを表す。
図6のグラフは、特徴量の時系列データP(τ)が1であるときのインデックスτと時間区間番号の位置を黒点で表している。従って、所定の時間区間の音響データの特徴量の時系列データP(τ)において、図6のグラフにおいて、その時間区間の時間区間番号に対応する横軸の位置に垂直の線上に並ぶ点に対応するτの時系列データP(τ)は1であり、その他のτの時系列データP(τ)は0である。
[同期情報生成部の構成例]
図7は、図3の同期情報生成部46の構成例を示すブロック図である。
図7の同期情報生成部46は、ブロック統合部121およびブロック統合部122、類似度計算部123、並びに最適パス検索部124により構成される。
同期情報生成部46のブロック統合部121は、図5のピーク検出部105から供給されるコンテンツAの時間区間ごとの特徴量の時系列データを、連続した複数(例えば64個)の時間区間を1ブロックとして、ブロック単位で統合する。ブロック統合部121は、ブロック単位の特徴量の時系列データを類似度計算部123に供給する。
ブロック統合部122は、図3の特徴量受信部45から供給されるコンテンツBの時間区間ごとの特徴量の時系列データを、連続した複数(例えば64個)の時間区間を1ブロックとして、ブロック単位で統合する。ブロック統合部122は、ブロック単位の特徴量の時系列データを類似度計算部123に供給する。
なお、ブロックを構成する複数の時間区間は、連続していなくてもよい。例えば、複数の偶数番目の時間区間を1ブロックとしたり、複数の奇数番目の時間区間を1ブロックとしたりすることもできる。この場合、時間区間ごとの特徴量の時系列データに対して間引き処理を行うことができるので、演算量を削減することができる。
類似度計算部123は、ブロック統合部121とブロック統合部122のそれぞれから供給されるブロック単位の特徴量の時系列データどうしの類似度を計算し、各ブロック間の類似度を表す類似度マトリックスを生成する。類似度計算部123は、類似度マトリックスを最適パス検索部124に供給する。
最適パス検索部124は、類似度計算部123から供給される類似度マトリックスから最適な類似度のパスを検索し、そのパス上の類似度に対応する2つのブロックの時間差を表す情報を同期情報として生成する。
以上のように、同期情報生成部46は、時間区間ごとのピーク情報P(τ)を特徴量の時系列データとして、その特徴量の時系列データが類似するコンテンツのブロックどうしを同期させる同期情報を生成する。即ち、同期情報生成部46は、音響データのピッチ情報に基づいて、同期情報を生成する。従って、音響データに信号処理装置ごとに異なるノイズが含まれる場合などにおいても、ロバストに同期情報を生成することができる。
なお、ここでは、ブロックごとに同期情報が生成されるものとするが、特徴量の時系列データ全体に対して同期情報が生成されるようにしてもよい。但し、ブロックごとに同期情報が生成される場合、後述するように、コンテンツAとコンテンツBの間の内部クロックのずれも補正することができる。
[類似度の計算の説明]
図8は、類似度の計算の対象とするブロックを説明する図である。
なお、iは、コンテンツAのブロックのインデックスであり、jは、コンテンツBのブロックのインデックスである。また、X(i)は、コンテンツAのインデックスiのブロックの特徴量の時系列データを表し、Y(j)は、コンテンツBのインデックスjのブロックの特徴量の時系列データを表す。
図8に示すように、類似度の計算の対象は、n個のX(i)のそれぞれと、m個のY(j)のそれぞれとの、n×m個の組み合わせである。
図9は、類似度の計算方法を説明する図である。
なお、図9のマトリックスでは、横軸が、ブロック内の時間区間の先頭からの個数を表すブロック内時間区間番号を表し、縦軸がインデックスτを表している。また、白色の正方形は、対応するブロック内時間区間番号の時間区間のインデックスτの特徴量の時系列データP(τ)が0であることを表し、黒色の正方形は、その時系列データP(τ)が1であることを表している。さらに、図9の例では、ブロックを構成する時間区間の個数が4個であり、τが0乃至3であるものとする。
図9に示すように、X(i)とY(j)の類似度を計算する場合、まず、X(i)とY(j)の論理積X(i)∩Y(j)が計算され、次に、X(i)とY(j)の論理和X(i)∪Y(j)が計算される。例えば、図9に示すように、9個の0と7個の1からなるX(i)とY(j)の類似度を計算する場合、まず、12個の0と4個の1からなる論理積X(i)∩Y(j)が計算され、6個の0と10個の1からなる論理和X(i)∪Y(j)が計算される。
そして、以下の式(2)により、論理積X(i)∩Y(j)の1の数であるNumber(X(i)∩Y(j))と論理和の1の数であるNumber(X(i)∪Y(j))に基づいて、X(i)とY(j)の類似度A(i,j)が計算される。
A(i,j)=Number(X(i)∩Y(j))/Number(X(i)∪Y(j))
・・・(2)
図9の例では、Number(X(i)∩Y(j))が4であり、Number(X(i)∪Y(j))が10であるので、類似度A(i,j)は0.4となる。
なお、特徴量の時系列データとして、周期性情報の総和S(τ)を採用した場合には、類似度の計算方法としてコサイン距離を用いて類似度を計算する方法などを採用することができる。
[最適な類似度のパスの検索の説明]
図10は、類似度マトリックスの例を示す図である。
なお、図10の類似度マトリックスにおいて、横軸は、コンテンツBのブロックのインデックスjであり、縦軸は、コンテンツAのブロックのインデックスiである。
図10に示すように、類似度マトリックスでは、インデックスiとインデックスjに対応する点が、類似度A(i,j)が大きいほど濃くなるように、類似度A(i,j)に応じた濃度で表される。
最適パス検索部124は、動的計画法を用いて、類似度マトリックス上のパスの類似度の積算値が最大となるパスを最適な類似度のパスとして検索する。
例えば、コンテンツAとコンテンツBの時間のずれが、いずれか一方の遅延によってのみ発生している場合、類似度A(i,j)が最大となるiとjの差分は常に一定であるため、類似度マトリックスを左上から右下に進む直線状のパスが最適な類似度のパスとして検索される。一方、コンテンツAとコンテンツBの間に内部クロックのずれが発生している場合、最適な類似度のパスは直線状ではない。
なお、ここでは、最適パス検索部124が、動的計画法を用いて類似度マトリックス上のとり得る全てのパスに対して検索を行うが、コンテンツAとコンテンツBの間に内部クロックのずれが発生していないことが予めわかっている場合には、類似度マトリックス上のとり得る全ての直線状のパスに対してのみ検索を行うようにしてもよい。
最適パス検索部124は、最適な類似度のパス上の類似度に対応するインデックスの差分i-jを、同期情報として生成する。
[同期情報の例]
図11は、同期情報の例を示す図である。
図11Aに示すように、コンテンツAとコンテンツBの間に内部クロックのずれが発生していない場合、即ち、コンテンツAとコンテンツBの時間のずれが、いずれか一方の遅延によってのみ発生している場合、一定値が同期情報として生成される。図11の例では、最適な類似度のパス上の類似度に対応するインデックスiとjの差分は常に80であり、同期情報として常に80が生成される。
一方、図11Bに示すように、コンテンツAとコンテンツBの間に内部クロックのずれが発生している場合、最適な類似度のパス上の類似度に対応するインデックスiとjの差分は、そのずれを補正するように変化する。図11の例では、インデックスiが1と2である場合、インデックスiとjの差分は79であるが、インデックスiが3である場合、内部クロックのずれの積算による同期のずれが大きくなるため、インデックスiとjの差分が1だけ増加されて80にされる。即ち、インデックスjが82であるブロックのコンテンツBがカットされる。
また、インデックスiが4である場合、インデックスiとjの差分は80のままであるが、インデックスiが5である場合、内部クロックのずれの積算による同期のずれが大きくなるため、インデクスiとjの差分が1だけ増加されて81にされる。即ち、インデックスjが85であるブロックのコンテンツBがカットされる。
さらに、インデックスiが6である場合、インデックスiとjの差分は81のままであるが、インデックスiが7である場合、内部クロックのずれの積算による同期のずれが大きくなるため、インデクスiとjの差分が1だけ増加されて82にされる。即ち、インデックスjが88であるブロックのコンテンツBがカットされる。そして、インデックスiが8である場合、インデックスiとjの差分は82のままである。
よって、インデックスiが1と2であるブロックの同期情報としては79が生成され、インデックスiが3と4であるブロックの同期情報としては80が生成される。また、インデックスiが5と6であるブロックの同期情報としては81が生成され、インデックスiが7と8であるブロックの同期情報としては82が生成される。
[信号処理システムの処理]
図12は、図1の信号処理システム10の再生準備処理を説明するフローチャートである。この再生準備処理は、ユーザが、信号処理装置11に対して再生対象とするコンテンツAのファイルを指令したとき、開始される。
図12のステップS11において、信号処理装置11の要求部52(図3)は、コンテンツBの特徴量の時系列データを信号処理装置12に要求する。
ステップS31において、信号処理装置12の特徴量算出部74(図4)は、要求部52からの要求を受信する。ステップS32において、ファイル選択部73は、ユーザにより再生対象とするコンテンツBのファイルが指令されたかどうかを判定する。受付部72から再生対象のファイルが通知されない場合、ファイル選択部73は、ステップS32でユーザにより再生対象とするコンテンツBのファイルが指令されていないと判定し、受付部72から再生対象のファイルが通知されるまで待機する。
一方、受付部72から再生対象のファイルが通知された場合、ステップS32でユーザにより再生対象とするコンテンツBのファイルが指令されたと判定され、処理はステップS33に進む。ステップS33において、ファイル選択部73は、受付部72からの通知にしたがって、記憶部71から再生対象のファイルのコンテンツBを読み出し、特徴量算出部74と再生部77に供給する。
ステップS34において、特徴量算出部74は、ファイル選択部73から供給されるコンテンツBのうちの音響データに基づいて特徴量の時系列データを算出し、特徴量送信部75に供給する。ステップS35において、特徴量送信部75は、特徴量算出部74から供給される特徴量の時系列データを信号処理装置11に送信する。
また、ステップS12において、信号処理装置11のファイル選択部43は、受付部42からの通知にしたがって、記憶部41から再生対象のファイルのコンテンツAを読み出し、特徴量算出部44と再生部49に供給する。
ステップS13において、特徴量算出部44は、ファイル選択部43から供給されるコンテンツAのうちの音響データに基づいて特徴量の時系列データを算出し、同期情報生成部46に供給する。
ステップS14において、特徴量受信部45は、ステップS35で信号処理装置12の特徴量送信部75から送信されてくるコンテンツBの特徴量の時系列データを受信し、同期情報生成部46に供給する。
ステップS15において、同期情報生成部46は、特徴量算出部44からのコンテンツAの特徴量の時系列データと、特徴量受信部45からのコンテンツBの特徴量の時系列データに基づいて、コンテンツAとコンテンツBを同期する際に用いられる同期情報を生成する。同期情報生成部46は、同期情報を制御情報生成部47と再生部49に供給する。
図13は、信号処理システム10の再生処理を説明するフローチャートである。この再生処理は、図12の再生準備処理が行われた後、ユーザにより再生ボタン21が操作されたとき開始される。
図13のステップS51において、再生部49は、受付部42から供給される再生ボタン21の操作に対応する指令に基づいて、コンテンツAの再生処理を開始する。再生部49は、その結果得られるコンテンツAの音響データと動画像データを出力部50に供給する。これにより、出力部50のディスプレイはコンテンツAの動画像を表示し、スピーカはコンテンツAの音響を出力する。
ステップS52において、制御情報生成部47は、同期情報と再生ボタン21の操作に対応する指令とに基づいて、再生開始制御情報を生成し、制御情報送信部48に供給する。ステップS53において、制御情報送信部48は、制御情報生成部47から供給される再生開始制御情報を信号処理装置12に送信する。
ステップS71において、信号処理装置12の制御情報受信部76は、ステップS53で制御情報送信部48から送信されてくる再生開始制御情報を受信し、再生部77に供給する。ステップS72において、再生部77は、再生開始制御情報にしたがって、再生開始制御情報が示す再生の開始位置からコンテンツBの再生処理を開始する。再生部77は、その結果得られるコンテンツBの音響データと動画像データを出力部78に供給する。これにより、出力部78のディスプレイはコンテンツBの動画像を表示し、スピーカはコンテンツBの音響を出力する。
また、ステップS53の処理後、ステップS54において、要求部52は、信号処理装置12にコンテンツBの再生位置を要求する。
ステップS73において、再生位置取得部79は、ステップS54で要求部52から送信されてきた要求を受信する。ステップS74において、再生位置取得部79は、再生部77により再生中のコンテンツBの位置を取得し、コンテンツBの再生位置として再生位置送信部80に供給する。ステップS75において、再生位置送信部80は、再生位置取得部79から供給されるコンテンツBの再生位置を信号処理装置11に送信する。
ステップS55において、再生位置受信部51は、ステップS75で再生位置送信部80から送信されてくるコンテンツBの再生位置を受信し、再生部49に供給する。ステップS56において、再生部49は、コンテンツAの再生位置、コンテンツBの再生位置、および同期情報に基づいて、コンテンツAとコンテンツBの同期がずれているかどうかを判定する。
具体的には、再生部49は、コンテンツAの再生位置、コンテンツBの再生位置、および同期情報に基づいて、コンテンツAとコンテンツBの同期のずれ量を計算する。そして、再生部49は、そのずれ量が所定の閾値以上である場合、ステップS56でコンテンツAとコンテンツBの同期がずれていると判定し、処理をステップS57に進める。
ステップS57において、再生部49は、コンテンツAの再生位置、コンテンツBの再生位置、および同期情報に基づいて、コンテンツAとコンテンツBが同期するようにコンテンツAの再生位置を変更する。そして、処理はステップS58に進む。
一方、コンテンツAとコンテンツBの同期のずれ量が所定の閾値より小さい場合、再生部49は、ステップS56でコンテンツAとコンテンツBの同期がずれていないと判定し、処理をステップS58に進める。
ステップS58において、要求部52は、再生を終了するかどうかを判定する。要求部52は、受付部42から一時停止ボタン22の操作に対応する指令が供給された場合、または、再生対象のコンテンツAが終端まで再生された場合、再生を終了すると判定し、処理を終了する。
一方、受付部42から一時停止ボタン22に対応する指令が供給されていない場合、または、再生対象のコンテンツAが終端まで再生されていない場合、ステップS58において、要求部52は、再生を終了しないと判定し、処理をステップS54に戻す。
なお、図13の再生処理では、信号処理装置11が、同期情報に基づいて再生位置を変更することにより同期のずれを補正したが、信号処理装置11と信号処理装置12のうちの時間が進んでいる方の信号処理装置が再生を一時停止し、他方で、その一時停止位置の同期位置が再生されるときに再生を再開することにより、同期のずれを補正するようにしてもよい。
図14は、信号処理システム10の再生位置変更処理を説明するフローチャートである。この再生位置変更処理は、例えば、図13の再生処理後、ユーザにより再生位置スクロール23が操作されたとき開始される。
図14のステップS91において、再生部49は、受付部42から供給される再生位置スクロール23の操作に対応する指令に基づいて、コンテンツAの再生処理における再生位置を変更する。
ステップS92において、再生部49は、変更後の再生位置を取得し、制御情報生成部47に供給する。ステップS93において、制御情報生成部47は、同期情報と、再生部49から供給される変更後の再生位置とに基づいて、再生位置変更制御情報を生成し、制御情報送信部48に供給する。
ステップS94において、制御情報送信部48は、制御情報生成部47から供給される再生位置変更制御情報を信号処理装置12に送信する。
ステップS111において、信号処理装置12の制御情報受信部76は、ステップS94で制御情報送信部48から送信されてくる再生位置変更制御情報を受信し、再生部77に供給する。
ステップS112において、再生部77は、再生位置変更制御情報にしたがって、再生位置変更制御情報が示す再生の変更位置に、コンテンツBの再生処理における再生位置を変更する。
図15は、信号処理システム10の再生一時停止処理を説明するフローチャートである。この再生一時停止処理は、例えば、図13の再生処理後、ユーザにより一時停止ボタン22が操作されたとき開始される。
図15のステップS131において、再生部49は、受付部42から供給される一時停止ボタン22の操作に対応する指令に基づいて、コンテンツAの再生処理を一時停止する。
ステップS132において、再生部49は、一時停止位置を取得し、制御情報生成部47に供給する。ステップS133において、制御情報生成部47は、同期情報と、再生部49から供給される一時停止位置とに基づいて、再生一時停止制御情報を生成し、制御情報送信部48に供給する。
ステップS134において、制御情報送信部48は、制御情報生成部47から供給される再生一時停止制御情報を信号処理装置12に送信する。
ステップS151において、信号処理装置12の制御情報受信部76は、ステップS134で制御情報送信部48から送信されてくる再生一時停止制御情報を受信し、再生部77に供給する。
ステップS152において、再生部77は、再生一時停止制御情報にしたがって、再生一時停止制御情報が示す再生の一時停止位置で、コンテンツBの再生処理を一時停止する。
図16は、信号処理システム10のエフェクト処理を説明するフローチャートである。このエフェクト処理は、例えば、図13の再生処理後、ユーザによりエフェクトボタン24が操作されたとき開始される。
図16のステップS171において、再生部49は、受付部42から供給されるエフェクトボタン24の操作に対応する指令に基づいて、再生中のコンテンツAに対してエフェクトを施す。再生部49は、エフェクトが施されたコンテンツAの音響データと動画像データを出力部50に供給する。これにより、出力部50のディスプレイには、エフェクトが施されたコンテンツAの動画像が表示され、出力部50のスピーカから、エフェクトが施されたコンテンツAの音響が出力される。
ステップS172において、再生部49は、再生位置を取得し、制御情報生成部47に供給する。ステップS173において、制御情報生成部47は、同期情報と、再生部49から供給される再生位置とに基づいて、エフェクト制御情報を生成し、制御情報送信部48に供給する。
ステップS174において、制御情報送信部48は、制御情報生成部47から供給されるエフェクト制御情報を信号処理装置12に送信する。
ステップS191において、信号処理装置12の制御情報受信部76は、ステップS174で制御情報送信部48から送信されてくるエフェクト制御情報を受信し、再生部77に供給する。
ステップS192において、再生部77は、エフェクト制御情報にしたがって、エフェクト制御情報が示すエフェクトを施す位置の再生処理後のコンテンツBにエフェクトを施し、エフェクトが施されたコンテンツBの音響データと動画像データを出力部78に供給する。これにより、出力部78のディスプレイには、エフェクトが施されたコンテンツBの動画像が表示され、出力部78のスピーカから、エフェクトが施されたコンテンツBの音響が出力される。
以上のように、信号処理システム10では、信号処理装置11が、同期情報に基づいて、コンテンツBに対する、再生開始制御情報、再生一時停止制御情報、再生位置変更制御情報、エフェクト制御情報などを生成する。これにより、信号処理装置11におけるコンテンツAに対する制御と、信号処理装置12におけるコンテンツBに対する制御を、時間的に同期して行うことができる。
また、信号処理装置12が、コンテンツそのものではなく、特徴量の時系列データを送信することにより、同期情報が生成される。従って、コンテンツそのものを送信する場合に比べて、信号処理装置11と信号処理装置12間の通信時間および通信データ量を削減することができる。
さらに、信号処理システム10では、コンテンツAとコンテンツBの再生を、それぞれ、別の信号処理装置が行うので、各信号処理装置は1つのコンテンツの再生処理を行うだけでよく、各信号処理装置の処理負荷が軽減される。
<第2実施の形態>
[信号処理システムの第2実施の形態の概要の説明]
図17は、本技術を適用した信号処理システムの第2実施の形態の概要を説明する図である。
図17に示すように、信号処理システム140は、信号処理装置141と信号処理装置142により構成される。
信号処理システム140では、信号処理装置141により再生されるコンテンツAのファイルは、ユーザにより指定されるが、信号処理装置142により再生されるコンテンツBのファイルは、そのコンテンツAに最も類似するコンテンツのファイルとされる。
より詳細には、信号処理装置141は、再生対象とするコンテンツAの特徴量の時系列データを信号処理装置142に送信する。信号処理装置142は、その特徴量の時系列データを受信する。信号処理装置142は、自分がファイルa1乃至ファイルc1として記憶しているコンテンツのうちの、コンテンツAの特徴量の時系列データと特徴量の時系列データが類似するコンテンツのファイルを、再生対象のコンテンツBのファイルとして決定する。
[信号処理装置141の構成例]
図18は、図17の信号処理装置141の構成例を示すブロック図である。
図18に示す構成のうち、図3の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図18の信号処理装置141の構成は、特徴量送信部161が新たに設けられる点、同期情報生成部46と特徴量受信部45の代わりに同期情報受信部162が設けられる点、および要求部52の代わりに要求部163が設けられる点が図3の構成と異なる。
特徴量送信部161は、特徴量算出部44により算出されたコンテンツAの特徴量の時系列データを信号処理装置142に送信する。
同期情報受信部162は、信号処理装置142から送信されてくる同期情報を受信し、制御情報生成部47と再生部49に供給する。
要求部163は、図3の要求部52と同様に、受付部42から供給される指令に基づいて、コンテンツAの再生中に、信号処理装置142にコンテンツBの再生位置を要求する。また、要求部163は、受付部42から供給される通知に応じて、信号処理装置142に再生の開始を要求する。
[信号処理装置142の構成例]
図19は、図17の信号処理装置142の構成例を示すブロック図である。
図19に示す構成のうち、図4の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図19の信号処理装置142の構成は、ファイル選択部73、特徴量算出部74の代わりに、ファイル選択部181、特徴量算出部182が設けられる点、特徴量送信部75の代わりに特徴量受信部183と同期情報生成部184が設けられる点、および同期情報送信部185が新たに設けられる点が図4の構成と異なる。
ファイル選択部181は、信号処理装置141の要求部163(図18)からの再生の開始の要求に応じて、記憶部71にファイルとして記憶されている全てのコンテンツを順に読み出し、特徴量算出部182に供給する。また、ファイル選択部181は、同期情報生成部184から供給される再生対象のファイルを指定する再生指定情報に基づいて、そのファイルのコンテンツを、記憶部71からコンテンツBとして読み出し、再生部77に供給する。
特徴量算出部182は、図5の特徴量算出部44と同様に構成される。特徴量算出部182は、ファイルごとに、ファイル選択部73から供給されるコンテンツのうちの音響データに基づいて特徴量の時系列データを算出し、同期情報生成部184に供給する。
特徴量受信部183は、信号処理装置141の特徴量送信部161(図18)から送信されてくるコンテンツAの特徴量の時系列データを受信し、同期情報生成部184に供給する。
同期情報生成部184は、ファイルごとに、特徴量算出部182からの特徴量の時系列データと、特徴量受信部183からのコンテンツAの特徴量の時系列データに基づいて、同期情報を生成する。そして、同期情報生成部184は、同期情報の生成時に検索された最適な類似度のパス上の類似度の平均値が最大となるファイルを、再生対象のコンテンツBのファイルに決定する。同期情報生成部184は、そのファイルを再生対象のファイルとして指定する再生指定情報をファイル選択部181に供給する。また、同期情報生成部184は、再生対象のコンテンツBのファイルに決定されたファイルの同期情報を同期情報送信部185に供給する。
同期情報送信部185は、同期情報生成部184から供給される同期情報を信号処理装置141に送信する。
[同期情報生成部の構成例]
図20は、図19の同期情報生成部184の構成例を示すブロック図である。
図20の同期情報生成部184は、ブロック統合部201、ブロック統合部202、類似度計算部203、最適パス検索部204、および再生指定情報生成部205により構成される。
同期情報生成部184のブロック統合部201は、ファイルごとに、図19の特徴量算出部182から供給されるコンテンツの時間区間ごとの特徴量の時系列データを、連続した複数(例えば64個)の時間区間を1ブロックとして、ブロック単位で統合する。ブロック統合部201は、ブロック単位の特徴量の時系列データをファイルごとに類似度計算部203に供給する。
ブロック統合部202は、図19の特徴量受信部183から供給されるコンテンツAの時間区間ごとの特徴量の時系列データを、連続した複数(例えば64個)の時間区間を1ブロックとして、ブロック単位で統合する。ブロック統合部202は、ブロック単位の特徴量の時系列データを類似度計算部203に供給する。
類似度計算部203は、ブロック統合部201から供給される各ファイルのブロック単位の特徴量の時系列データと、ブロック統合部202から供給されるブロック単位の特徴量の時系列データとの類似度を、上述した式(2)により、ファイルごとに計算する。類似度計算部203は、その結果得られるファイルごとの類似度マトリックスを最適パス検索部204に供給する。
最適パス検索部204は、ファイルごとに、動的計画法を用いて、類似度計算部203から供給される類似度マトリックス上のパスの類似度の積算値が最大となるパスを最適な類似度のパスとして検索し、同期情報を生成する。
また、最適パス検索部204は、ファイルごとの同期情報と、その同期情報に対応する最適な類似度のパス上の類似度の平均値を、再生指定情報生成部205に供給する。
再生指定情報生成部205は、最適パス検索部204から供給される類似度の平均値が最大となるファイルを、再生対象のコンテンツBのファイルに決定し、そのファイルを再生対象のファイルとして指定する再生指定情報を生成する。そして、再生指定情報生成部205は、再生指定情報をファイル選択部181に供給する。また、再生指定情報生成部205は、再生対象のコンテンツBのファイルに決定されたファイルの同期情報を同期情報送信部185に供給する。
[信号処理システムの処理]
図21は、図17の信号処理システム140の再生準備処理を説明するフローチャートである。この再生準備処理は、ユーザが、信号処理装置141に対して再生対象とするコンテンツAのファイルを指令したとき、開始される。
図21のステップS211において、信号処理装置141の要求部163(図18)は、受付部42から供給される通知に応じて、信号処理装置142に再生の開始を要求する。
ステップS231において、信号処理装置142のファイル選択部181(図19)は、ステップS211で要求部163から送信されてくる要求を受信する。
また、ステップS211の処理後、処理はステップS212に進む。ステップS212とS213の処理は、図12のステップS12とS13の処理と同様であるので、説明は省略する。
ステップS214において、特徴量送信部161は、ステップS213の処理で算出されたコンテンツAの特徴量の時系列データを信号処理装置142に送信する。
ステップS232において、特徴量受信部183は、ステップS214で特徴量送信部161から送信されてくるコンテンツAの特徴量の時系列データを受信し、同期情報生成部184に供給する。
ステップS233において、ファイル選択部181は、記憶部71から読み出すファイルの先頭からの番号Fiを1に設定する。ステップS234において、ファイル選択部181は、記憶部71から、先頭からFi番目のファイルを読み出し、特徴量算出部182に供給する。
ステップS235において、特徴量算出部182は、ファイル選択部73から供給されるコンテンツのうちの音響データに基づいて特徴量の時系列データを算出し、同期情報生成部184に供給する。
ステップS236において、同期情報生成部184の類似度計算部203(図20)は、特徴量算出部182からブロック統合部201を介して供給されるブロック単位の特徴量の時系列データと、特徴量受信部183からブロック統合部202を介して供給されるブロック単位の特徴量の時系列データとの類似度を、上述した式(2)により計算する。類似度計算部203は、その結果得られるファイルごとの類似度マトリックスを最適パス検索部204に供給する。
ステップS237において、最適パス検索部204は、動的計画法を用いて、類似度計算部203から供給される類似度マトリックス上のパスの類似度の積算値の最大値を求める。
ステップS238において、最適パス検索部204は、類似度の積算値の最大値に対応するパスを最適な類似度のパスとして検索し、同期情報を生成する。最適パス検索部204は、同期情報と、その同期情報に対応する最適な類似度のパス上の類似度の平均値を、再生指定情報生成部205に供給する。
ステップS239において、ファイル選択部181は、Fiが、記憶部71に記憶されているファイル数Fimaxであるかどうかを判定する。ステップS239でFiがFimaxではないと判定された場合、ステップS240において、ファイル選択部181は、Fiを1だけインクリメントし、処理をステップS234に戻す。
一方、ステップS239でFiがFimaxであると判定された場合、ステップS241において、再生指定情報生成部205は、最適パス検索部204から供給される類似度の平均値が最大となるファイルを、再生対象のコンテンツBのファイルに決定する。そして、再生指定情報生成部205は、そのファイルを再生対象のファイルとして指定する再生指定情報を生成し、ファイル選択部181に供給する。また、再生指定情報生成部205は、再生対象のコンテンツBのファイルに決定されたファイルの同期情報を同期情報送信部185に供給する。
ステップS242において、同期情報送信部185は、再生指定情報生成部205から供給される同期情報を信号処理装置141に送信する。
ステップS215において、同期情報受信部162は、ステップS242で同期情報送信部185から送信されてくる同期情報を受信し、制御情報生成部47と再生部49に供給する。
信号処理システム140の再生処理、再生位置変更処理、再生一時停止処理、エフェクト処理は、それぞれ、図13の再生処理、図14の再生位置変更処理、図15の再生一時停止処理、図16のエフェクト処理と同様であるので、説明は省略する。
なお、信号処理装置142が、コンテンツBを選択するのではなく、信号処理装置142が、記憶部71に記憶されている各コンテンツの特徴量の時系列データを信号処理装置141に送信し、信号処理装置141が、そのコンテンツの特徴量の時系列データとコンテンツAの特徴量の時系列データの類似度に基づいてコンテンツBを選択するようにしてもよい。この場合、信号処理装置141から信号処理装置142に、コンテンツBを再生対象とする指令が送信される。
<第3実施の形態>
[信号処理システムの第3実施の形態の概要の説明]
図22は、本技術を適用した信号処理システムの第3実施の形態の概要を説明する図である。
図22に示すように、信号処理システム220は、信号処理装置221と信号処理装置222により構成される。
信号処理システム220では、信号処理装置221と信号処理装置222に記憶されているコンテンツの組み合わせのうち、類似度の高いコンテンツの組み合わせが提示され、ユーザが、その組み合わせの中から所望の組み合わせを再生対象として選択する。
より詳細には、信号処理装置221は、自分が記憶しているファイルa2乃至c2のコンテンツの特徴量の時系列データを信号処理装置222に送信する。信号処理装置222は、信号処理装置221から受信されたファイルa2乃至c2のコンテンツの特徴量の時系列データのそれぞれについて、自分が記憶しているファイルa1乃至c1のコンテンツの特徴量の時系列データのそれぞれとの類似度を計算する。信号処理装置222は、ファイルa2乃至c2それぞれについて、類似度が所定の閾値以上となるファイルa1乃至c1のいずれかを、再生対象として推薦する推薦ファイルに決定し、その推薦ファイルの情報を信号処理装置221に送信して提示させる。
[信号処理装置221の構成例]
図23は、図22の信号処理装置221の構成例を示すブロック図である。
図23に示す構成のうち、図18の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図23の信号処理装置221の構成は、受付部42、ファイル選択部43、同期情報受信部162、出力部50、要求部163の代わりに、受付部240、ファイル選択部241、同期情報受信部242、出力部245、要求部246が設けられている点、および推薦ファイル受信部243と推薦リスト作成部244が新たに設けられる点が図18の構成と異なる。
受付部240は、ユーザからの指令を受け付ける。具体的には、受付部240は、受付部42と同様に、ユーザからの撮影開始の指令を受け付け、その指令を取得部40に供給する。また、受付部240は、ユーザからの再生対象とするコンテンツAとコンテンツBのファイルの指令を受け付け、コンテンツAのファイルをファイル選択部241に通知し、コンテンツBのファイルを要求部246に通知する。さらに、受付部240は、コンテンツAとコンテンツBのファイルを同期情報受信部242に通知する。
さらに、受付部240は、受付部42と同様に、ユーザが再生ボタン21、一時停止ボタン22、再生位置スクロール23、またはエフェクトボタン24を操作することにより行う指令を受け付け、その指令を制御情報生成部47、再生部49、および要求部246に供給する。また、受付部240は、ユーザからの、コンテンツAとコンテンツBの組み合わせを推薦する推薦処理の開始の指令を受け付け、その指令をファイル選択部241と要求部246に供給する。
ファイル選択部241は、受付部240から供給される推薦処理の開始の指令に応じて、記憶部41に記憶されている全てのファイルのコンテンツを順に読み出し、特徴量算出部44に供給する。これにより、記憶部41に記憶されている全てのファイルのコンテンツの特徴量の時系列データが、特徴量送信部161から信号処理装置222に送信される。また、ファイル選択部241は、受付部240からの通知にしたがって、記憶部41から再生対象のファイルのコンテンツAを読み出し、再生部49に供給する。
同期情報受信部242は、記憶部41に記憶されている各コンテンツについて、信号処理装置222から送信されてくる、そのコンテンツと推薦ファイルのコンテンツとの同期情報を受信する。同期情報受信部242は、受付部240から供給されるコンテンツAとコンテンツBのファイルの通知に基づいて、受信された同期情報の中から、コンテンツAとコンテンツBの同期情報を選択し、制御情報生成部47と再生部49に供給する。
推薦ファイル受信部243は、信号処理装置222から送信されてくる、記憶部41に記憶される各コンテンツについての推薦ファイルを特定する推薦ファイル情報を受信し、推薦リスト作成部244に供給する。
推薦リスト作成部244は、推薦ファイル受信部243から供給される推薦ファイル情報に基づいて、記憶部41に記憶される各コンテンツのファイルを特定する情報と、そのコンテンツの推薦ファイル情報を対応付けた推薦リストを作成する。即ち、推薦リストは、記憶部41に記憶されるコンテンツと、記憶部71に記憶されるコンテンツの組み合わせのうちの、再生対象として推薦する1以上の組み合わせを示すリストである。推薦リスト作成部244は、推薦リストを出力部245に供給する。
出力部245は、ディスプレイとスピーカ等により構成される。出力部245のスピーカは、出力部50のスピーカと同様に、再生部49から供給される音響データに対応する音響を出力する。また、出力部245のディスプレイは、出力部50のディスプレイと同様に、再生部49から供給される動画像データに基づいて動画像を表示する。また、出力部245のディスプレイは、推薦リスト作成部244から供給される推薦リストを表示する。
要求部246は、図3の要求部52や図18の要求部163と同様に、受付部240から供給される指令に基づいて、コンテンツAの再生中に、信号処理装置222にコンテンツBの再生位置を要求する。また、要求部246は、受付部240から供給される推薦処理の開始の指令に応じて、信号処理装置222に推薦処理の開始を要求する。さらに、要求部246は、受付部240から通知されるコンテンツBのファイルに基づいて、そのファイルの再生の開始を信号処理装置222に要求する。
[信号処理装置222の構成例]
図24は、図22の信号処理装置222の構成例を示すブロック図である。
図24に示す構成のうち、図19の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図24の信号処理装置222の構成は、ファイル選択部181、同期情報生成部184、同期情報送信部185の代わりに、ファイル選択部261、同期情報生成部262、同期情報送信部265が設けられている点、および推薦ファイル選択部263と推薦ファイル送信部264が新たに設けられている点が図19の構成と異なる。
ファイル選択部261は、信号処理装置221の要求部246(図23)からの推薦処理の開始の要求に応じて、記憶部71にファイルとして記憶されている全てのコンテンツを順に読み出し、特徴量算出部182に供給する。また、ファイル選択部181は、要求部246からの所定のファイルの再生の開始の要求に応じて、記憶部71から、そのファイルのコンテンツをコンテンツBとして読み出し、再生部77に供給する。
同期情報生成部262は、記憶部71に記憶されるファイルごとに、特徴量算出部182から供給される特徴量の時系列データと、特徴量受信部183からの各ファイルの特徴量の時系列データとに基づいて、図3の同期情報生成部46と同様の方法で同期情報を生成する。即ち、同期情報生成部262は、記憶部41に記憶されるファイルのうちの1つと、記憶部71に記憶されるファイルのうちの1つからなる複数の組み合わせごとに、同期情報を生成する。
また、同期情報生成部262は、記憶部41に記憶されるファイルのうちの1つと、記憶部71に記憶されるファイルのうちの1つからなる複数の組み合わせごとの同期情報の生成時に検索された最適な類似度のパス上の類似度の積算値を、推薦ファイル選択部263に供給する。
また、同期情報生成部262は、記憶部41に記憶されるファイルのうちの1つと、記憶部71に記憶されるファイルのうちの1つからなる複数の組み合わせごとの同期情報を同期情報送信部265に供給する。
推薦ファイル選択部263は、記憶部41に記憶されるファイルごとに、同期情報生成部262から供給される、記憶部71に記憶されるファイルごとの類似度の積算値のうち、その積算値が所定の閾値以上となるファイルを推薦ファイルとして選択する。推薦ファイル選択部263は、推薦ファイル情報を推薦ファイル送信部264と同期情報送信部265に供給する。
推薦ファイル送信部264は、推薦ファイル選択部263から供給される推薦ファイル情報を信号処理装置221に送信する。
同期情報送信部265は、同期情報生成部184から供給される同期情報のうちの、推薦ファイル選択部263から供給される推薦ファイル情報により特定される推薦ファイルの同期情報を、信号処理装置221に送信する。
[信号処理システムの処理]
図25および図26は、図22の信号処理システム220の再生準備処理を説明するフローチャートである。この再生準備処理は、ユーザが、信号処理装置221に対して推薦処理の開始を指令したとき、開始される。
ステップS261において、要求部246は、受付部240から供給される推薦処理の開始の指令に応じて、信号処理装置222に推薦処理の開始を要求する。
ステップS291において、ファイル選択部261は、ステップS261で要求部246から送信されてくる推薦処理の開始の要求を受信する。
また、ステップS261の処理後、ステップS262において、ファイル選択部241は、記憶部41から読み出すファイルの先頭からの番号Fjを1に設定する。ステップS263において、ファイル選択部241は、記憶部41から、先頭からFj番目のファイルを読み出し、特徴量算出部44に供給する。
ステップS264において、特徴量算出部44は、ファイル選択部241から供給されるコンテンツのうちの音響データに基づいて特徴量の時系列データを算出し、特徴量送信部161に供給する。ステップS265において、特徴量送信部161は、特徴量算出部44から供給される特徴量の時系列データを信号処理装置222に送信する。
ステップS292において、特徴量受信部183は、ステップS265で特徴量送信部161から送信されてくる特徴量の時系列データを受信し、同期情報生成部262に供給する。そして、処理はステップS293に進む。
ステップS293乃至S300の処理は、図21のステップS233乃至S240の処理と同様であるので、説明は省略する。
ステップS299でFiがFimaxであると判定された場合、ステップS301において、推薦ファイル選択部263は、同期情報生成部262から供給される、記憶部71に記憶されるFimax個のファイルの類似度の積算値のうち、その積算値が所定の閾値以上となるファイルを、推薦ファイルとして選択する。推薦ファイル選択部263は、推薦ファイル情報を推薦ファイル送信部264と同期情報送信部265に供給する。
ステップS302において、推薦ファイル送信部264は、推薦ファイル選択部263から供給される推薦ファイル情報を信号処理装置221に送信する。また、同期情報送信部265は、同期情報生成部184から供給される同期情報のうちの、推薦ファイル選択部263から供給される推薦ファイル情報により特定される推薦ファイルの同期情報を、信号処理装置221に送信する。
ステップS266において、推薦ファイル受信部243は、信号処理装置222から送信されてくる、先頭からFj番目のファイルの推薦ファイル情報を受信し、推薦リスト作成部244に供給する。また、同期情報受信部242は、信号処理装置222から送信されてくる、先頭からFj番目のファイルの推薦ファイルとの同期情報を受信する。
ステップS267において、ファイル選択部241は、Fjが、記憶部41に記憶されているファイル数Fjmaxであるかどうかを判定する。ステップS267でFjがFjmaxではないと判定された場合、ステップS268において、ファイル選択部241は、Fjを1だけインクリメントし、処理をステップS263に戻す。
一方、ステップS267でFjがFjmaxであると判定された場合、処理は図26のステップS269に進む。ステップS269において、推薦リスト作成部244は、推薦ファイル受信部243から供給される推薦ファイル情報に基づいて、記憶部41に記憶されている各コンテンツのファイルを特定する情報と、そのコンテンツの推薦ファイル情報を対応付けた推薦リストを作成する。そして、推薦リスト作成部244は、推薦リストを出力部245に供給する。
ステップS270において、出力部245のディスプレイは、推薦リスト作成部244から供給される推薦リストの情報に基づいて、推薦リストを表示する。ステップS271において、受付部240は、ユーザにより再生対象とするコンテンツAとコンテンツBのファイルの組み合わせが指令されたかどうかを判定する。
具体的には、ユーザは、出力部245のディスプレイに表示されている推薦リストを見ながら、その推薦リストに登録されている情報から、互いに対応付けられている所望の2つのコンテンツのファイルを特定する情報を、再生対象のコンテンツAとコンテンツBのファイルを特定する情報として選択する指令を行う。
その指令が行われていない場合、受付部240は、ステップS271でユーザにより再生対象とするコンテンツAとコンテンツBのファイルの組み合わせが指令されていないと判定し、その指令が行われるまで待機する。
一方、推薦リストに登録されている情報から、互いに対応付けられている所望の2つのコンテンツのファイルを特定する情報を、再生対象のコンテンツAとコンテンツBのファイルを特定する情報として選択する指令が行われた場合、ステップS271でユーザにより再生対象とするコンテンツAとコンテンツBのファイルの組み合わせが指令されたと判定される。
そして、受付部240は、コンテンツAのファイルをファイル選択部241に通知し、コンテンツBのファイルを要求部246に通知し、コンテンツAとコンテンツBのファイルを同期情報受信部242に通知する。そして、処理はステップS272に進む。
ステップS272において、ファイル選択部241は、受付部240からの通知にしたがって、記憶部41からコンテンツAを読み出し、コンテンツAを再生部49に供給する。
ステップS273において、同期情報受信部242は、受付部240から供給されるコンテンツAとコンテンツBのファイルの通知に基づいて、受信された同期情報の中から、コンテンツAとコンテンツBの同期情報を選択する。そして、同期情報受信部242は、コンテンツAとコンテンツBの同期情報を制御情報生成部47と再生部49に供給する。
ステップS274において、要求部246は、受付部240から供給される再生対象のコンテンツBのファイルの通知に基づいて、そのファイルの再生の開始を信号処理装置222に要求する。
ステップS303において、ファイル選択部261は、ステップS274で要求部246から送信されてくるコンテンツBのファイルの再生の開始の要求を受信する。ステップS304において、ファイル選択部261は、記憶部71から、コンテンツBのファイルのコンテンツをコンテンツBとして読み出し、再生部77に供給する。
信号処理システム220の再生処理、再生位置変更処理、再生一時停止処理、エフェクト処理は、それぞれ、図13の再生処理、図14の再生位置変更処理、図15の再生一時停止処理、図16のエフェクト処理と同様であるので、説明は省略する。
なお、信号処理装置221が、推薦リストを作成するのではなく、信号処理装置222が推薦リストを作成し、信号処理装置222に送信するようにしてもよい。また、信号処理装置222が、推薦ファイルを選択するのではなく、信号処理装置222が、記憶部71に記憶される各コンテンツの特徴量の時系列データを信号処理装置221に送信し、信号処理装置221が、推薦ファイルを選択し、推薦リストを作成するようにしてもよい。
<第4実施の形態>
[信号処理システムの第4実施の形態の概要の説明]
図27は、本技術を適用した信号処理システムの第4実施の形態の概要を説明する図である。
図27に示すように、信号処理システム280は、信号処理装置281と信号処理装置282により構成される。図27の例では、信号処理装置281は、図1の信号処理装置11と同様に、同一のイベントを左方向から撮影して音響を取得し、信号処理装置282は、図1の信号処理装置12と同様に、同一のイベントを右方向から撮影して音響を取得する。
信号処理装置281と信号処理装置282は、それぞれ、このようにして得られた動画像と音響のコンテンツに、撮影時刻を示す撮影時刻情報としてのタイムスタンプを付加する。そして、信号処理装置281と信号処理装置282は、同一のイベントの2つのコンテンツを同時に再生する場合、タイムスタンプを参照して、再生対象のコンテンツを同期させる。
信号処理装置281には、図2の信号処理装置11と同様に、再生ボタン21、一時停止ボタン22、再生位置スクロール23、エフェクトボタン24などが表示されるが、さらに、同期合わせボタン291も表示される。同期合わせボタン291は、音響データの特徴量の時系列データを用いた同期情報によりコンテンツAとコンテンツBの再生位置を同期させるときに操作されるボタンである。例えば、ユーザは、同期ずれが発生していると認識した場合に、同期合わせボタン291を操作する。
ユーザにより同期合わせボタン291が操作されると、信号処理装置282は、コンテンツBの特徴量の時系列データを算出し、信号処理装置281に送信する。そして、信号処理装置281は、自分自身で算出したコンテンツAの特徴量の時系列データと信号処理装置282から受信されたコンテンツBの特徴量の時系列データとに基づいて、同期情報を生成する。そして、信号処理装置281は、同期情報に基づいて、コンテンツAの再生位置を、コンテンツBの再生位置に同期するように変更する。
[信号処理装置281の構成例]
図28は、図27の信号処理装置281の構成例を示すブロック図である。
図28に示す構成のうち、図3の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図28の信号処理装置281の構成は、取得部40、受付部42、特徴量算出部44、要求部52の代わりに、取得部300、受付部301、特徴量算出部304、要求部306が設けられる点、および新たにタイムスタンプ取得部302とタイムスタンプ受信部303が設けられる点が図3の構成と異なる。
信号処理装置281の取得部300は、図3の取得部40と同様に、CCDカメラとマイク等により構成される。取得部300は、取得部40と同様に、受付部301からの指令に応じて、被写体を撮影し、音響を取得する。取得部300は、その結果得られる動画像と音響のコンテンツにタイムスタンプを付加し、記憶部41に供給して記憶させる。
受付部301は、ユーザからの指令を受け付ける。具体的には、受付部301は、図3の受付部42と同様に、ユーザからの撮影開始の指令を受け付け、その指令を取得部300に供給する。また、受付部301は、受付部42と同様に、ユーザからの再生対象とするコンテンツAのファイルの指令を受け付け、そのファイルを再生対象のファイルとしてファイル選択部43と要求部306に通知する。
さらに、受付部301は、受付部42と同様に、ユーザが再生ボタン21、一時停止ボタン22、再生位置スクロール23、またはエフェクトボタン24を操作することにより行う指令を受け付け、その指令を制御情報生成部47、再生部49、および要求部306に供給する。また、受付部301は、ユーザが同期合わせボタン291を操作することにより行う特徴量に基づく同期合わせの指令を受け付け、その指令を特徴量算出部44と要求部306に供給する。
タイムスタンプ取得部302は、ファイル選択部43により読み出されたコンテンツAに付加されているタイムスタンプを取得し、同期情報生成部305に供給する。タイムスタンプ受信部303は、信号処理装置282から送信されてくる、コンテンツBのタイムスタンプを受信し、同期情報生成部305に供給する。
特徴量算出部304は、受付部301から供給される指令に応じて、ファイル選択部43から供給されるコンテンツAのうちの音響データに基づいて特徴量の時系列データを算出し、同期情報生成部305に供給する。
同期情報生成部305は、タイムスタンプ取得部302から供給されるコンテンツAのタイムスタンプから、タイムスタンプ受信部303から供給されるコンテンツBのタイムスタンプの差分を求め、同期情報の初期情報として生成する。
また、同期情報生成部305は、図3の同期情報生成部46と同様に、特徴量算出部304からのコンテンツAの特徴量の時系列データと、特徴量受信部45からのコンテンツBの特徴量の時系列データに基づいて、同期情報を生成する。同期情報生成部305は、同期情報生成部46と同様に、同期情報を制御情報生成部47と再生部49に供給する。
要求部306は、図3の要求部52と同様に、受付部301から供給される指令に基づいて、コンテンツAの再生中に、信号処理装置282にコンテンツBの再生位置を要求する。また、要求部306は、受付部301から供給される通知に応じて、コンテンツBのタイムスタンプを信号処理装置282に要求する。さらに、要求部306は、受付部301から供給される特徴量に基づく同期合わせの指令に応じて、コンテンツBの特徴量の時系列データを要求する。
[信号処理装置282の構成例]
図29は、図27の信号処理装置282の構成例を示すブロック図である。
図29に示す構成のうち、図4の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図29の信号処理装置281の構成は、主に、取得部70の代わりに取得部320が設けられる点、および、タイムスタンプ取得部321とタイムスタンプ送信部322が新たに設けられる点が図4の構成と異なる。
信号処理装置281の取得部320は、図4の取得部70と同様に、CCDカメラとマイク等により構成される。取得部320は、取得部70と同様に、受付部72からの指令に応じて、被写体を撮影し、音響を取得する。取得部320は、その結果得られる動画像と音響のコンテンツにタイムスタンプを付加し、記憶部71に供給して記憶させる。
タイムスタンプ取得部321は、信号処理装置281の要求部306(図28)からのタイムスタンプの要求に応じて、ファイル選択部73から読み出されたコンテンツBに付加されているタイムスタンプを取得し、タイムスタンプ送信部322に供給する。
タイムスタンプ送信部322は、タイムスタンプ取得部321から供給されるタイムスタンプを信号処理装置281に送信する。
[信号処理システムの処理]
図30は、図27の信号処理システム280の再生準備処理を説明するフローチャートである。この再生準備処理は、ユーザが、信号処理装置281に対して再生対象とするコンテンツAのファイルを指令したとき、開始される。
図12のステップS321において、信号処理装置281の要求部306(図28)は、コンテンツBのタイムスタンプを信号処理装置282に要求する。
ステップS341において、信号処理装置282のタイムスタンプ取得部321(図29)は、要求部306からの要求を受信する。ステップS342とS343の処理は、それぞれ、図12のステップS32,S33の処理と同様であるので、説明は省略する。
ステップS343の処理後、ステップS344において、タイムスタンプ取得部321は、ファイル選択部73から供給されるコンテンツBに付加されたタイムスタンプを取得し、タイムスタンプ送信部322に供給する。ステップS345において、タイムスタンプ送信部322は、タイムスタンプ取得部321から供給されるタイムスタンプを信号処理装置281に送信する。
また、ステップS322において、信号処理装置281のファイル選択部43は、受付部42からの通知にしたがって、記憶部41から再生対象のファイルのコンテンツAを読み出す。そして、ファイル選択部43は、コンテンツAをタイムスタンプ取得部302、特徴量算出部304、および再生部49に供給する。
ステップS323において、タイムスタンプ取得部302は、ファイル選択部43から供給されるコンテンツAに付加されているタイムスタンプを取得し、同期情報生成部305に供給する。
ステップS324において、タイムスタンプ受信部303は、ステップS345でタイムスタンプ送信部322から送信されてくるコンテンツBのタイムスタンプを受信し、同期情報生成部305に供給する。
ステップS325において、同期情報生成部305は、タイムスタンプ取得部302からのコンテンツAのタイムスタンプと、タイムスタンプ受信部303からのコンテンツBのタイムスタンプに基づいて、同期情報の初期情報を生成する。同期情報生成部305は、同期情報の初期情報を制御情報生成部47と再生部49に供給する。
図31は、信号処理システム280の再生処理を説明するフローチャートである。この再生処理は、図30の再生準備処理が行われた後、ユーザにより再生ボタン21が操作されたとき開始される。
図31のステップS361乃至S363の処理は、図13のステップS51乃至S53の処理と同様であり、ステップS391およびS392の処理は、それぞれ、ステップS71,S72の処理と同様であるので、説明は省略する。
ステップS364において、受付部301は、ユーザにより特徴量に基づく同期合わせが指令されたかどうか、即ち、同期合わせボタン291の操作に対応する指令を受け付けたかどうかを判定する。ステップS364でユーザにより特徴量に基づく同期合わせが指令されていないと判定された場合、受付部301は、その指令が行われるまで待機する。
一方、ステップS364でユーザにより特徴量に基づく同期合わせが指令されたと判定された場合、受付部301は、その指令を特徴量算出部304と要求部306に供給する。そして、ステップS365において、要求部306は、信号処理装置282にコンテンツBの特徴量の時系列データを要求する。
ステップS392の処理後、ステップS393において、信号処理装置282の特徴量算出部74は、ステップS365で要求部306から送信されてくる要求を受信する。ステップS394において、特徴量算出部74は、ファイル選択部73から供給されるコンテンツBのうちの音響データに基づいて特徴量の時系列データを算出し、特徴量送信部75に供給する。ステップS395において、特徴量送信部75は、特徴量算出部74から供給される特徴量の時系列データを信号処理装置281に送信する。
また、ステップS365の処理後、ステップS366において、特徴量算出部304は、ファイル選択部43から供給されるコンテンツAのうちの音響データに基づいて特徴量の時系列データを算出し、同期情報生成部305に供給する。
ステップS367において、特徴量受信部45は、ステップS395で特徴量送信部75から送信されてくるコンテンツBの特徴量の時系列データを受信し、同期情報生成部305に供給する。
ステップS368において、同期情報生成部305は、特徴量算出部304からのコンテンツAの特徴量の時系列データと、特徴量受信部45からのコンテンツBの特徴量の時系列データに基づいて、同期情報を生成し、更新する。そして、同期情報生成部305は、更新後の同期情報を制御情報生成部47と再生部49に供給し、処理をステップS369に進める。
ステップS369乃至S373の処理は、図13のステップS54乃至S58の処理と同様であるので、説明は省略する。また、ステップS396乃至S398の処理は、図13のステップS73乃至S75の処理と同様であるので、説明は省略する。
信号処理システム280の再生位置変更処理、再生一時停止処理、エフェクト処理は、それぞれ、図14の再生位置変更処理、図15の再生一時停止処理、図16のエフェクト処理と同様であるので、説明は省略する。
<第5実施の形態>
[信号処理システムの第5実施の形態の信号処理装置の構成例]
図32は、本技術を適用した信号処理システムの第5実施の形態を構成する2つの信号処理装置のうちの、ユーザからの指令を受け付ける信号処理装置の構成例を示すブロック図である。
図32に示す構成のうち、図3や図28の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図32の信号処理装置341の構成は、要求部306、特徴量算出部304、受付部301の代わりに、要求部351、特徴量算出部352、受付部353が設けられる点が図28の構成と異なる。
信号処理装置341は、再生対象とするコンテンツAのファイルの指令を受け付けると、タイムスタンプに基づいて同期情報の初期情報を生成し、再生ボタン21が操作されると、特徴量の時系列データに基づいて同期情報を生成する。
具体的には、信号処理装置341の要求部351は、図3の要求部52と同様に、受付部353から供給される指令に基づいて、コンテンツAの再生中に、他方の信号処理装置282にコンテンツBの再生位置を要求する。また、要求部351は、図28の要求部306と同様に、受付部353から供給される通知に応じて、コンテンツBのタイムスタンプを信号処理装置282に要求する。さらに、要求部351は、受付部353から供給される、再生ボタン21を操作することにより行われる指令に応じて、コンテンツBの特徴量の時系列データを要求する。
特徴量算出部352は、受付部353から供給される指令に応じて、ファイル選択部43から供給されるコンテンツAのうちの音響データに基づいて特徴量の時系列データを算出し、同期情報生成部305に供給する。
受付部353は、ユーザからの指令を受け付ける。具体的には、受付部353は、図3の受付部42と同様に、ユーザからの撮影開始の指令を受け付け、その指令を取得部300に供給する。また、受付部353は、受付部42と同様に、ユーザからの再生対象とするコンテンツAのファイルの指令を受け付け、そのファイルを再生対象のファイルとしてファイル選択部43と要求部351に通知する。
さらに、受付部353は、受付部42と同様に、ユーザが再生ボタン21、一時停止ボタン22、再生位置スクロール23、またはエフェクトボタン24を操作することにより行う指令を受け付け、その指令を制御情報生成部47、再生部49、および要求部351に供給する。また、受付部353は、ユーザが再生ボタン21を操作することにより行う指令を特徴量算出部352と要求部351に供給する。
[信号処理システムの処理]
第5実施の形態の信号処理システムの再生準備処理は、図30の再生準備処理と同様であるので、説明は省略する。
図33は、第5実施の形態の信号処理システムの再生処理を説明するフローチャートである。この再生処理は、再生準備処理が行われた後、ユーザにより再生ボタン21が操作されたとき開始される。
図33の再生処理は、図31のステップS364の処理が行われない点を除いて、図31の再生処理と同様である。即ち、図33のステップS411乃至S422の処理は、図31のステップS361乃至S363およびS365乃至S373と同様であり、ステップS441乃至S448の処理は、図31のステップS391乃至S398の処理と同様である。
このように、第5実施の形態の信号処理システムでは、再生ボタン21が操作されると、自動的に、コンテンツAとコンテンツBの特徴量の時系列データに基づく同期情報が生成される。
第5実施の形態の信号処理システムの再生位置変更処理、再生一時停止処理、エフェクト処理は、それぞれ、図14の再生位置変更処理、図15の再生一時停止処理、図16のエフェクト処理と同様であるので、説明は省略する。
なお、第5実施の形態において、再生ボタン21の操作の有無にかかわらず、再生準備処理の終了後、即座に、コンテンツAとコンテンツBの特徴量の時系列データに基づく同期情報の生成が行われるようにしてもよい。この場合、コンテンツAとコンテンツBの特徴量の時系列データに基づく同期情報が生成されているときには、再生開始制御情報は、その同期情報に基づいて生成され、その同期情報がまだ生成されていないときには、再生開始制御情報は、タイムスタンプに基づく同期情報に基づいて生成される。
<第6実施の形態>
[信号処理システムの構成例]
図34は、本技術を適用した信号処理システムの第6実施の形態の構成例を示すブロック図である。
なお、図34に示す構成のうち、図1や図2の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図34の信号処理システム370の構成は、信号処理装置11の代わりに信号処理装置371が設けられる点、および、新たにサーバ372が設けられる点が図1や図2の構成と異なる。信号処理システム370では、信号処理装置371と信号処理装置12が、再生対象のコンテンツの時系列の特徴量データをサーバ372に送信し、サーバ372が、その特徴量データに基づいて同期情報を生成する。
具体的には、信号処理装置371は、ユーザからの指令に応じて、コマンドをサーバ372に送信するとともに、コンテンツAの再生を制御する。また、信号処理装置371は、ユーザからの指令に応じて、コンテンツBの再生位置の信号処理装置12への要求をサーバ372に送信する。さらに、信号処理装置371は、ユーザからの指令に応じて、コンテンツAの特徴量の時系列データをサーバ372に送信する。
また、信号処理装置371は、要求に応じて信号処理装置12から送信されてくるコンテンツBの再生位置と同期情報からなる同期制御情報を、サーバ372から受信する。信号処理装置371は、その同期制御情報に基づいてコンテンツAの再生位置を変更することにより、同期のずれを補正する。
サーバ372は、信号処理装置371から送信されてくるコンテンツAの特徴量の時系列データと、信号処理装置12から送信されてくるコンテンツBの特徴量の時系列データを受信する。サーバ372は、コンテンツAの特徴量の時系列データとコンテンツBの特徴量の時系列データとに基づいて、同期情報を生成する。
また、サーバ372は、信号処理装置371から送信されてくるコマンドを受信し、そのコマンドと同期情報に基づいて、再生開始制御情報、再生一時停止制御情報、再生位置変更制御情報、またはエフェクト制御情報を生成する。サーバ372は、生成された再生開始制御情報、再生一時停止制御情報、再生位置変更制御情報、またはエフェクト制御情報を、信号処理装置12に送信する。
さらに、サーバ372は、信号処理装置371から送信されてくるコンテンツBの再生位置の要求を受信し、その要求を信号処理装置12に送信する。そして、サーバ372は、その要求に応じて信号処理装置12から送信されてくるコンテンツBの再生位置を受信し、そのコンテンツBの再生位置と同期情報を同期制御情報として信号処理装置371に送信する。
[信号処理装置371の構成例]
図35は、図34の信号処理装置371の構成例を示すブロック図である。
図35に示す構成のうち、図3の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図35の信号処理装置371は、取得部40、記憶部41、受付部42、ファイル選択部43、特徴量算出部44、出力部50、コマンド送信部391、要求部392、特徴量送信部393、再生部394、および同期制御情報受信部395により構成される。
コマンド送信部391は、受付部42により受け付けられた、ユーザが再生ボタン21を操作することにより行う指令に応じて、再生を開始するコマンドである再生開始コマンドを生成する。
また、コマンド送信部391は、受付部42により受け付けられた、ユーザが一時停止ボタン22を操作することにより行う指令と、再生部394から供給される一時停止位置とに基づいて、その一時停止位置を指定し、その一時停止位置の同期位置での再生の一時停止を指令する再生一時停止コマンドを生成する。
さらに、コマンド送信部391は、受付部42により受け付けられた、ユーザが再生位置スクロール23を操作することにより行う指令と、再生部394から供給される変更後の再生位置とに基づいて、その再生位置を指定し、その再生位置の同期位置への再生位置の変更を指令するコマンドである再生位置変更コマンドを生成する。
また、コマンド送信部391は、受付部42により受け付けられた、ユーザがエフェクトボタン24を操作することにより行う指令と、再生部394から供給されるエフェクトを施したときの再生位置とに基づいて、その再生位置を指定し、その再生位置の同期位置でのエフェクトを指令するコマンドであるエフェクトコマンドを生成する。
コマンド送信部391は、再生開始コマンド、再生一時停止コマンド、再生位置変更コマンド、またはエフェクトコマンドをサーバ372に送信する。また、コマンド送信部391は、受付部42により受け付けられた、ユーザからの再生対象とするコンテンツAのファイルの指令に応じて、再生準備コマンドをサーバ372に送信する。
要求部392は、受付部42により受け付けられた、ユーザが、再生ボタン21、一時停止ボタン22、再生位置スクロール23、およびエフェクトボタン24を操作することにより行う指令に基づいて、コンテンツAの再生中に、コンテンツBの再生位置の要求をサーバ372に送信する。
特徴量送信部393は、特徴量算出部44により算出されたコンテンツAの特徴量の時系列データをサーバ372に送信する。
再生部394は、受付部42から供給される指令に基づいて、ファイル選択部43から供給されるコンテンツAの再生を制御する。具体的には、再生部394は、ユーザが再生ボタン21を操作することにより行われる指令に基づいて、コンテンツAの再生処理を開始し、再生されたコンテンツAの音響データと動画像データを出力部50に供給する。
また、再生部394は、ユーザが一時停止ボタン22を操作することによる指令に基づいて、コンテンツAの再生処理を一時停止し、一時停止位置をコマンド送信部391に供給する。再生部394は、ユーザが再生位置スクロール23を操作することによる指令に基づいて、コンテンツAの再生処理における再生位置を変更し、変更後の再生位置をコマンド送信部391に供給する。再生部394は、エフェクトボタン24を操作することによる指令に基づいて、再生中のコンテンツAに対してエフェクトを施し、エフェクトが施されたコンテンツAの音響データと動画像データを出力部50に供給する。また、再生部394は、エフェクトを施したときの再生位置をコマンド送信部391に供給する。
さらに、再生部394は、コンテンツAの再生位置、並びに、同期制御情報受信部395から供給される同期制御情報を構成するコンテンツBの再生位置および同期情報に基づいて、コンテンツAとコンテンツBの同期のずれ量を計算する。再生部394は、図3の再生部49と同様に、ずれ量が所定の閾値以上である場合、コンテンツAの再生位置、コンテンツBの再生位置、および同期情報に基づいて、コンテンツAとコンテンツBが同期するようにコンテンツAの再生位置を変更する。そして、再生部394は、再生部49と同様に、変更後のコンテンツAの再生位置からコンテンツAの再生処理を行い、再生されたコンテンツAを出力部50に供給する。
同期制御情報受信部395は、サーバ372から送信されてくる同期制御情報を受信し、再生部394に供給する。
[サーバの構成例]
図36は、図34のサーバ372の構成例を示すブロック図である。
図36のサーバ372は、コマンド受信部411、特徴量要求部412、特徴量受信部413、同期情報生成部414、制御情報生成部415、制御情報送信部416、要求受信部417、再生位置要求部418、再生位置受信部419、同期制御情報生成部420、および同期制御情報送信部421により構成される。
サーバ372のコマンド受信部411は、信号処理装置371から送信されてくる、再生準備コマンド、再生開始コマンド、再生一時停止コマンド、再生位置変更コマンド、またはエフェクトコマンドを受信する。コマンド受信部411は、再生準備コマンドを特徴量要求部412に供給する。また、コマンド受信部411は、再生開始コマンド、再生一時停止コマンド、再生位置変更コマンド、またはエフェクトコマンドを制御情報生成部415に供給する。
特徴量要求部412は、コマンド受信部411から供給される再生準備コマンドに応じて、信号処理装置12にコンテンツBの特徴量の時系列データを要求する。
特徴量受信部413は、信号処理装置371の特徴量送信部393(図35)から送信されてくるコンテンツAの特徴量の時系列データを受信し、同期情報生成部414に供給する。また、特徴量受信部413は、信号処理装置12の特徴量送信部75(図4)から送信されてくるコンテンツBの特徴量の時系列データを受信し、同期情報生成部414に供給する。
同期情報生成部414は、図3の同期情報生成部46と同様に構成される。同期情報生成部414は、特徴量受信部413から供給されるコンテンツAの特徴量の時系列データとコンテンツBの特徴量の時系列データとに基づいて、同期情報を生成する。同期情報生成部414は、生成された同期情報を制御情報生成部415と同期制御情報生成部420に供給する。
制御情報生成部415は、同期情報生成部414から供給される同期情報と、コマンド受信部411から供給される再生開始コマンドに基づいて、再生開始制御情報を生成する。制御情報生成部415は、同期情報と、再生一時停止コマンドが指定する一時停止位置に基づいて、再生一時停止制御情報を生成する。
また、制御情報生成部415は、同期情報と、再生位置変更コマンドが指定する変更後の再生位置とに基づいて、再生位置変更制御情報を生成する。さらに、制御情報生成部415は、同期情報と、エフェクトコマンドが指定するエフェクトを施したときの再生位置とに基づいて、エフェクト制御情報を生成する。制御情報生成部415は、生成された再生開始制御情報、再生一時停止制御情報、再生位置変更制御情報、またはエフェクト制御情報を制御情報送信部416に供給する。
制御情報送信部416は、制御情報生成部415から供給される再生開始制御情報、再生一時停止制御情報、再生位置変更制御情報、またはエフェクト制御情報を信号処理装置12に送信する。
要求受信部417は、信号処理装置371の要求部392(図35)から送信されてくるコンテンツBの再生位置の要求を受信し、再生位置要求部418に供給する。再生位置要求部418は、要求受信部417から供給されるコンテンツBの再生位置の要求を、信号処理装置12に送信する。
再生位置受信部419は、再生位置要求部418から送信された要求に応じて信号処理装置12の再生位置送信部80(図4)から送信されてくる、コンテンツBの再生位置を受信する。再生位置受信部419は、コンテンツBの再生位置を同期制御情報生成部420に供給する。
同期制御情報生成部420は、再生位置受信部419から供給されるコンテンツBの再生位置と、同期情報生成部414から供給される同期情報とから、同期制御情報を生成し、同期制御情報送信部421に供給する。同期制御情報生成部420は、同期制御情報生成部420から供給される同期情報を、信号処理装置371に送信する。
[信号処理システムの処理]
図37は、図34の信号処理システム370の再生準備処理を説明するフローチャートである。この再生準備処理は、ユーザが、信号処理装置371に対して再生対象とするコンテンツAのファイルを指令したとき、開始される。
ステップS461において、信号処理装置371のコマンド送信部391(図35)は、受付部42により受け付けられた、ユーザからの再生対象とするコンテンツAのファイルの指令に応じて、再生準備コマンドをサーバ372に送信する。
ステップS481において、サーバ372のコマンド受信部411(図36)は、ステップS461で信号処理装置371から送信されてくる再生準備コマンドを受信し、特徴量要求部412に供給する。ステップS482において、特徴量要求部412は、コマンド受信部411から供給される再生準備コマンドに応じて、信号処理装置12にコンテンツBの特徴量の時系列データを要求する。
図37のステップS501乃至S505の処理は、図12のステップS31乃至S35の処理と同様であるので、説明は省略する。
ステップS461の処理後、処理はステップS462に進む。ステップS462とS463の処理は、それぞれ、図12のステップS12,S13の処理と同様であるので、説明は省略する。
ステップS463の処理後、ステップS464において、特徴量送信部393は、特徴量算出部44により算出されたコンテンツAの特徴量の時系列データをサーバ372に送信する。
ステップS483において、特徴量受信部413は、ステップS464で特徴量送信部393から送信されてくるコンテンツAの特徴量の時系列データを受信し、同期情報生成部414に供給する。
ステップS484において、特徴量受信部413は、ステップS505で特徴量送信部75から送信されてくるコンテンツBの特徴量の時系列データを受信し、同期情報生成部414に供給する。
ステップS485において、同期情報生成部414は、特徴量受信部413から供給されるコンテンツAの特徴量の時系列データとコンテンツBの特徴量の時系列データとに基づいて、同期情報を生成する。
図38は、図34の信号処理システム370の再生処理を説明するフローチャートである。この再生処理は、図37の再生準備処理が行われた後、ユーザにより再生ボタン21が操作されたとき開始される。
図38のステップS521において、信号処理装置371の再生部394(図35)は、受付部42から供給される、ユーザが再生ボタン21を操作することにより行われる指令に基づいて、コンテンツAの再生処理を開始する。再生部394は、再生されたコンテンツAの音響データと動画像データを出力部50に供給する。これにより、出力部50のディスプレイはコンテンツAの動画像を表示し、スピーカはコンテンツAの音響を出力する。
ステップS522において、コマンド送信部391は、受付部42により受け付けられた、ユーザが再生ボタン21を操作することにより行われるユーザからの指令に応じて、再生開始コマンドをサーバ372に送信する。
ステップS541において、サーバ372のコマンド受信部411(図36)は、ステップS522で信号処理装置371から送信されてくる再生開始コマンドを受信し、制御情報生成部415に供給する。
ステップS542において、制御情報生成部415は、同期情報生成部414から供給される同期情報と、コマンド受信部411から供給される再生開始コマンドに基づいて、再生開始制御情報を生成し、制御情報送信部416に供給する。
ステップS543において、制御情報送信部416は、制御情報生成部415から供給される再生開始制御情報を信号処理装置12に送信する。
図38のステップS561およびS562の処理は、それぞれ、図13のステップS71,S72の処理と同様である。
ステップS522の処理後、ステップS523において、要求部392は、コンテンツBの再生位置の要求をサーバ372に送信する。
ステップS544において、要求受信部417は、ステップS523で要求部392から送信されてくるコンテンツBの再生位置の要求を受信し、再生位置要求部418に供給する。
ステップS545において、再生位置要求部418は、要求受信部417から供給されるコンテンツBの再生位置の要求を、信号処理装置12に送信する。
ステップS563乃至S565の処理は、図13のステップS73乃至S75の処理と同様であるので、説明は省略する。
ステップS546において、再生位置受信部419は、ステップS565で再生位置送信部80から送信されてくる、コンテンツBの再生位置を受信する。再生位置受信部419は、コンテンツBの再生位置を同期制御情報生成部420に供給する。
ステップS547において、同期制御情報生成部420は、再生位置受信部419から供給されるコンテンツBの再生位置と、同期情報生成部414から供給される同期情報とから、同期制御情報を生成し、同期制御情報送信部421に供給する。ステップS548において、同期制御情報生成部420は、同期制御情報生成部420から供給される同期情報を、信号処理装置371に送信する。
ステップS524において、同期制御情報受信部395は、サーバ372から送信されてくる同期制御情報を受信し、再生部394に供給する。ステップS525において、再生部394は、コンテンツAの再生位置、並びに、同期制御情報受信部395から供給される同期制御情報を構成するコンテンツBの再生位置および同期情報に基づいて、図13のステップS56の処理と同様に、コンテンツAとコンテンツBの同期がずれているかどうかを判定する。
ステップS525でコンテンツAとコンテンツBの同期がずれていると判定された場合、処理はステップS526に進む。一方、ステップS525でコンテンツAとコンテンツBの同期がずれていないと判定された場合、処理はステップS527に進む。
ステップS526とS527の処理は、それぞれ、図13のステップS57,S58の処理と同様であるので、説明は省略する。
図39は、図34の信号処理システム370の再生位置変更処理を説明するフローチャートである。この再生位置変更処理は、例えば、図38の再生処理後、ユーザにより再生位置スクロール23が操作されたとき開始される。
図39のステップS581において、再生部394は、受付部42から供給される、ユーザが再生位置スクロール23を操作することによる指令に基づいて、コンテンツAの再生処理における再生位置を変更する。ステップS582において、再生部394は、変更後の再生位置を取得し、コマンド送信部391に供給する。
ステップS583において、信号処理装置371のコマンド送信部391は、受付部42から供給される、ユーザが再生位置スクロール23を操作することによる指令と、再生部394から供給される変更後の再生位置とに基づいて、再生位置変更コマンドをサーバ372に送信する。
ステップS601において、サーバ372のコマンド受信部411は、ステップS583でコマンド送信部391から送信されてくる再生位置変更コマンドを受信し、制御情報生成部415に供給する。
ステップS602において、制御情報生成部415は、コマンド受信部411から供給される再生位置変更コマンドが指定する再生位置と、同期情報生成部414から供給される同期情報に基づいて、再生位置変更制御情報を生成し、制御情報送信部416に供給する。ステップS603において、制御情報送信部416は、制御情報生成部415から供給される再生位置変更制御情報を信号処理装置12に送信する。
ステップS621とS622の処理は、それぞれ、図14のS111,S112の処理と同様であるので、説明は省略する。
図40は、信号処理システム370の再生一時停止処理を説明するフローチャートである。この再生一時停止処理は、例えば、図38の再生処理後、ユーザにより一時停止ボタン22が操作されたとき開始される。
図40のステップS641において、信号処理装置371の再生部394(図35)は、受付部42から供給される、ユーザが一時停止ボタン22を操作することによる指令に基づいて、コンテンツAの再生処理を一時停止する。
ステップS642において、再生部394は、一時停止位置を取得し、コマンド送信部391に供給する。ステップS643において、コマンド送信部391は、受付部42から供給される、ユーザが一時停止ボタン22を操作することによる指令と、再生部394から供給される一時停止位置とに基づいて、再生一時停止コマンドを生成し、サーバ372に送信する。
ステップS661において、サーバ372のコマンド受信部411(図36)は、ステップS643でコマンド送信部391から送信されてくる再生一時停止コマンドを受信し、制御情報生成部415に供給する。
ステップS662において、制御情報生成部415は、制御情報生成部415から供給される再生一時停止コマンドが指定する一時停止位置と、同期情報生成部414から供給される同期情報とに基づいて、再生一時停止制御情報を生成する。そして、制御情報生成部415は、生成された再生一時停止制御情報を制御情報送信部416に供給する。
ステップS663において、制御情報送信部416は、制御情報生成部415から供給される再生一時停止制御情報を信号処理装置12に送信する。
ステップS681とS682の処理は、それぞれ、図15のステップS151,S12の処理と同様であるので、説明は省略する。
図41は、信号処理システム370のエフェクト処理を説明するフローチャートである。このエフェクト処理は、例えば、図38の再生処理後、ユーザによりエフェクトボタン24が操作されたとき開始される。
図41のステップS701において、信号処理装置371の再生部394(図35)は、受付部42から供給される、ユーザがエフェクトボタン24を操作することによる指令に基づいて、再生中のコンテンツAに対してエフェクトを施す。再生部394は、エフェクトが施されたコンテンツAの音響データと動画像データを出力部50に供給する。
ステップS702において、再生部394は、再生位置を取得し、コマンド送信部391に供給する。ステップS703において、コマンド送信部391は、受付部42から供給される、ユーザがエフェクトボタン24を操作することによる指令と、再生部394から供給される再生位置とに基づいて、エフェクトコマンドを生成し、サーバ372に送信する。
ステップS721において、サーバ372のコマンド受信部411(図36)は、ステップS703でコマンド送信部391から送信されてくるエフェクトコマンドを受信し、制御情報生成部415に供給する。
ステップS722において、制御情報生成部415は、コマンド受信部411から供給されるエフェクトコマンドが指定するエフェクトを施したときの再生位置と、同期情報生成部414から供給される同期情報とに基づいて、エフェクト制御情報を生成する。制御情報生成部415は、そのエフェクト制御情報を制御情報送信部416に供給する。
ステップS723において、制御情報送信部416は、制御情報生成部415から供給されるエフェクト制御情報を信号処理装置12に送信する。
ステップS741とS742の処理は、それぞれ、図16のS191,S192の処理と同様であるので、説明は省略する。
以上のように、信号処理システム370では、信号処理装置371と信号処理装置12がコンテンツそのものではなく、コンテンツの特徴量の時系列データをサーバ372にアップロードする。従って、コンテンツそのものをアップロードする場合に比べて、サーバ372への送信時間を短縮することができる。また、プライバシーの問題などで、コンテンツをサーバ372にアップロードしたくない場合であっても、信号処理装置371と信号処理装置12は、時間的に同期して再生を制御することができる。
なお、第6実施の形態では、同期情報と制御情報の生成をサーバ372が行ったが、同期情報の生成のみをサーバ372が行い、制御情報の生成は、信号処理装置371または信号処理装置12が行うようにしてもよい。このとき、制御情報の通信は、サーバ372を介さずに、信号処理装置371と信号処理装置12間で直接行われるようにしてもよい。
また、信号処理装置12において、ユーザによる指令が受け付けられ、サーバ372が信号処理装置371に制御情報を送信するようにしてもよい。
また、第1乃至第5実施の形態では、制御情報の生成を信号処理装置11(141,221,281,341,371)が行ったが、信号処理装置11(141,221,281,341,371)が同期情報とユーザからの指令を信号処理装置12(142,222,282)に送信し、その信号処理装置12(142,222,282)が制御情報を生成するようにしてもよい。
さらに、上述した説明では、信号処理装置11(141,221,281,341)において、ユーザによる指令が受け付けられたが、信号処理装置12(142,222,282)においてユーザによる指令が受け付けられるようにしてもよい。
この場合、信号処理装置12(142,222,282)が、ユーザからの指令に基づいてコマンドを生成して信号処理装置11(141,221,281,341)に送信し、信号処理装置11(141,221,281,341)が同期情報とコマンドに基づいて制御情報を生成する。または、信号処理装置11(141,221,281,341)が同期情報を信号処理装置12(142,222,282)に送信し、信号処理装置12(142,222,282)が、同期情報とユーザからの指令に基づいて制御情報を生成し、信号処理装置11(141,221,281,341)に送信する。
また、この場合、信号処理装置142が、ユーザからの再生対象とするコンテンツBのファイルの指令を信号処理装置141に送信し、信号処理装置141が、コンテンツAを自動的に選択することもできる。
さらに、第1乃至第6実施の形態では、信号処理システムが2つの信号処理装置を備えるようにしたが、3つ以上の信号処理装置が備えられるようにしてもよい。
また、特徴量としては、ピーク情報P(τ)のほか、音響データのレベル、音響データのレベルの立ち上がり位置などの情報を採用することもできる。
例えば、音響データのレベルの情報を特徴量とする場合、音響データが数10msecの時間区間に分割され、時間区間ごとの音響データのRMS(Root Mean Square)値や平均値が特徴量の時系列データとして求められる。そして、特徴量の時系列データどうしの相互相関関数が類似度として計算される。
なお、この場合、帯域通過フィルタによって複数の周波数帯域に分割された音響データのレベルの情報を特徴量とするようにしてもよい。この場合、相互相関関数は周波数帯域ごとに求められ、各周波数帯域の相互相関関数の総和が類似度として求められる。
また、音響データのレベルの立ち上がり位置の情報を特徴量とする場合、特徴量は、例えば、音響データの立ち上がり位置、即ち微分値が閾値以上になる位置の値を1とし、それ以外の値を0とした情報である。
また、特徴量としては、George Tzanetakis and Perry Cook. Musical genre classification of audio signals. IEEE Transactions on Speech and Audio Processing, 10(5):293-302, July 2002.に開示されている特徴量のうちの、Zero Crossing Rate, Spectrum Flux, Spectrum Centroid, Roll-Offなどを単独で用いたり、組み合わせて用いたりすることも可能である。これらの特徴量を組み合わせて用いる場合、各特徴量の相互相関関数が類似度として求められる。
さらに、特徴量としては、上述した情報そのものではなく、その情報のピーク位置、即ち微分値が正から負に変わる位置のうち、レベルが閾値以上となる位置の値を1とし、それ以外を0とした情報を用いることも可能である。
また、信号処理装置11(141,221,281,341,371)には、再生速度変換ボタン、静止画切り出しボタン、ズームインボタン、ズームアウトボタン等を表示することもできる。
再生速度変換ボタンは、所定の倍率で再生速度を変換し、スロー再生や早回し再生を行うときに操作されるボタンである。再生速度変換ボタンが操作された場合、そのときのコンテンツAの再生位置から、所定の倍率で変換された再生速度で再生されるとともに、その再生位置の同期位置から、コンテンツAの変換後の再生速度と同一の再生速度で再生される。
静止画切り出しボタンは、コンテンツAとコンテンツBを静止画像として配置するときに操作されるボタンである。静止画切り出しボタンが操作された場合、そのときのコンテンツAとコンテンツBの画像を並べて配置した画像が、2つの信号処理装置のいずれかで生成され、静止画切り出しボタンの操作を受け付ける信号処理装置において表示される。なお、静止画切り出しボタンの操作を受け付ける信号処理装置以外の信号処理装置にも表示するようにしてもよい。
ズームインボタンは、コンテンツAとコンテンツBに対してズームイン処理を施すときに操作されるボタンである。ズームインボタンが操作された場合、そのときのコンテンツAに対してズームイン処理が施され、ズームイン処理が施されたコンテンツAの再生位置の同期位置で、コンテンツBに対してズームイン処理が施される。ズームアウトボタンについては、ズームイン処理の代わりにズームアウト処理が施される点を除いて、ズームインボタンと同様である。
<本技術を適用したコンピュータの説明>
[コンピュータの構成例]
上述した一連の信号処理装置やサーバによる処理は、ハードウェアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウェアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。
図42は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。
コンピュータにおいて、CPU(Central Processing Unit)501,ROM(Read Only Memory)502,RAM(Random Access Memory)503は、バス504により相互に接続されている。
バス504には、さらに、入出力インタフェース505が接続されている。入出力インタフェース505には、入力部506、出力部507、記憶部508、通信部509、及びドライブ510が接続されている。
入力部506は、キーボード、マウス、マイクロフォンなどよりなる。出力部507は、ディスプレイ、スピーカなどよりなる。記憶部508は、ハードディスクや不揮発性のメモリなどよりなる。通信部509は、ネットワークインタフェースなどよりなる。ドライブ510は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブルメディア511を駆動する。
以上のように構成されるコンピュータでは、CPU501が、例えば、記憶部508に記憶されているプログラムを、入出力インタフェース505及びバス504を介して、RAM503にロードして実行することにより、上述した一連の処理が行われる。
コンピュータ(CPU501)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア511に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。
コンピュータでは、プログラムは、リムーバブルメディア511をドライブ510に装着することにより、入出力インタフェース505を介して、記憶部508にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部509で受信し、記憶部508にインストールすることができる。その他、プログラムは、ROM502や記憶部508に、あらかじめインストールしておくことができる。
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
また、本明細書において、システムとは、複数の構成要素(装置、モジュール(部品)等)の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、1つの筐体の中に複数のモジュールが収納されている1つの装置は、いずれも、システムである。
本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
例えば、第4実施の形態の信号処理システム280や第5実施の形態の信号処理システムにおいて、第2実施の形態の信号処理システム140と同様に、コンテンツBのファイルを自動的に決定するようにしてもよいし、第3実施の形態の信号処理システム220と同様に、推薦リストを提示するようにしてもよい。
また、第6実施の形態の信号処理システム370において、サーバ372が、第2実施の形態の信号処理装置142と同様に、コンテンツBのファイルを自動的に決定し、信号処理装置12に指示するようにしてもよい。また、第6実施の形態の信号処理システム370において、サーバ372が、第3実施の形態の信号処理装置222と同様に推薦ファイルを選択し、信号処理装置221と同様に推薦リストを提示するようにしてもよい。
本技術は、動画と音響のコンテンツを取得する信号処理装置だけでなく、音響データのみを取得する録音装置に適用することもできる。この場合、本技術は、例えば、楽器演奏を録音する際に複数の録音装置としてのIC(Integrated Circuit)レコーダを各楽器の近くに設置して録音し、その結果得られる音響データを各ICレコーダで同時再生する音響再生システムに適用することができる。
また、本技術は、外部から取得したコンテンツを記憶し、再生を行う信号処理装置にも適用することができる。
なお、本技術は、以下のような構成もとることができる。
(1)
第1のコンテンツに含まれる音響信号の特徴量の時系列データである第1の特徴量データを算出する特徴量算出部と、
他の信号処理装置から送信されてくる第2のコンテンツに含まれる音響信号の前記特徴量の時系列データである第2の特徴量データを受信する特徴量受信部と、
前記特徴量算出部により算出された前記第1の特徴量データと、前記特徴量受信部により受信された前記第2の特徴量データとを用いて、前記第1のコンテンツと前記第2のコンテンツを同期する際に用いられる同期情報を生成する同期情報生成部と、
前記同期情報生成部により生成された前記同期情報を用いて、前記第1のコンテンツまたは前記第2のコンテンツに対する制御情報を生成する制御情報生成部と
を備える信号処理装置。
(2)
前記制御情報は、前記第1のコンテンツまたは前記第2のコンテンツの再生開始位置、再生一時停止位置、再生変更位置、またはエフェクトを施す位置を示す情報である
前記(1)に記載の信号処理装置。
(3)
複数の前記第1のコンテンツまたは複数の前記第2のコンテンツの一方のそれぞれごとに、前記第1のコンテンツの前記第1の特徴量データと、前記第2のコンテンツの前記第2の特徴量データの類似度を計算する類似度計算部と、
前記類似度計算部により計算された前記類似度に基づいて、前記複数の第1のコンテンツまたは前記複数の第2のコンテンツの一方のうちの1つを再生対象として指定する再生指定情報を生成する再生指定情報生成部と
をさらに備える
前記(1)に記載の信号処理装置。
(4)
複数の前記第1のコンテンツのうちの1つと、複数の前記第2のコンテンツのうちの1つからなる複数の組み合わせごとに、前記第1の特徴量データと前記第2の特徴量データの類似度を計算する類似度計算部と、
前記類似度計算部により計算された前記類似度に基づいて、前記複数の組み合わせのうちの、再生対象として推薦する1以上の組み合わせを示す推薦リストを作成する推薦リスト作成部と
をさらに備える
前記(1)に記載の信号処理装置。
(5)
前記第1のコンテンツの時刻情報を取得する時刻情報取得部と、
前記他の情報処理装置から前記第2のコンテンツの時刻情報を受信する時刻情報受信部と、
前記第1のコンテンツの時刻情報と前記第2のコンテンツの時刻情報に基づいて、前記同期情報の初期情報を生成する初期同期情報生成部と
をさらに備え、
前記同期情報生成部は、ユーザの指示に応じて前記同期情報を生成し、
前記制御情報生成部は、前記同期情報が生成されるまで、前記初期同期情報生成部により生成された前記同期情報の初期情報を用いて前記制御情報を生成し、前記同期情報が生成された場合、前記同期情報生成部により生成された前記同期情報を用いて前記制御情報を生成する
前記(1)に記載の信号処理装置。
(6)
前記第1のコンテンツの時刻情報を取得する時刻情報取得部と、
前記他の情報処理装置から前記第2のコンテンツの時刻情報を受信する時刻情報受信部と
をさらに備え、
前記同期情報生成部は、前記第1のコンテンツの時刻情報と前記第2のコンテンツの時刻情報に基づいて、前記同期情報の初期情報を生成し、
前記制御情報生成部は、前記同期情報生成部により生成された前記同期情報の初期情報を用いて、前記制御情報としての前記第1のコンテンツまたは前記第2のコンテンツの再生開始位置を示す情報を生成する
前記(1)に記載の信号処理装置。
(7)
前記制御情報生成部は、前記同期情報生成部により生成された前記同期情報を用いて、前記制御情報としての前記第1のコンテンツまたは前記第2のコンテンツの再生開始位置を示す情報以外の情報を生成する
前記(6)に記載の信号処理装置。
(8)
信号処理装置が、
第1のコンテンツに含まれる音響信号の特徴量の時系列データである第1の特徴量データを算出する特徴量算出ステップと、
他の信号処理装置から送信されてくる第2のコンテンツに含まれる音響信号の前記特徴量の時系列データである第2の特徴量データを受信する特徴量受信ステップと、
前記特徴量算出ステップの処理により算出された前記第1の特徴量データと、前記特徴量受信ステップの処理により受信された前記第2の特徴量データとを用いて、前記第1のコンテンツと前記第2のコンテンツを同期する際に用いられる同期情報を生成する同期情報生成ステップと、
前記同期情報生成ステップの処理により生成された前記同期情報を用いて、前記第1のコンテンツまたは前記第2のコンテンツに対する制御情報を生成する制御情報生成ステップと
を含む信号処理方法。
(9)
コンピュータを、
第1のコンテンツに含まれる音響信号の特徴量の時系列データである第1の特徴量データを算出する特徴量算出部と、
他の信号処理装置から送信されてくる第2のコンテンツに含まれる音響信号の前記特徴量の時系列データである第2の特徴量データを受信する特徴量受信部と、
前記特徴量算出部により算出された前記第1の特徴量データと、前記特徴量受信部により受信された前記第2の特徴量データとを用いて、前記第1のコンテンツと前記第2のコンテンツを同期する際に用いられる同期情報を生成する同期情報生成部と、
前記同期情報生成部により生成された前記同期情報を用いて、前記第1のコンテンツまたは前記第2のコンテンツに対する制御情報を生成する制御情報生成部と
して機能させるためのプログラム。
(10)
第1のコンテンツに含まれる音響信号の特徴量の時系列データである第1の特徴量データを算出する特徴量算出部と、
他の信号処理装置から送信されてくる第2のコンテンツに含まれる音響信号の前記特徴量の時系列データである第2の特徴量データを受信する特徴量受信部と、
前記特徴量算出部により算出された前記第1の特徴量データと、前記特徴量受信部により受信された前記第2の特徴量データとを用いて、前記第1のコンテンツと前記第2のコンテンツを同期する際に用いられる同期情報を生成する同期情報生成部と、
前記同期情報生成部により生成された前記同期情報を用いて、前記第1のコンテンツまたは前記第2のコンテンツに対する制御情報を生成する制御情報生成部と
を備える電子機器。
(11)
第1のコンテンツに含まれる音響信号の特徴量の時系列データである第1の特徴量データを算出する特徴量算出部と、
前記第1の特徴量データを他の信号処理装置に送信する特徴量送信部と、
前記他の信号処理装置から、前記第1の特徴量データと、第2のコンテンツに含まれる音響信号の前記特徴量の時系列データである第2の特徴量データとを用いて生成された、前記第1のコンテンツと前記第2のコンテンツを同期する際に用いられる同期情報を受信する同期情報受信部と、
前記同期情報受信部により受信された前記同期情報を用いて、前記第1のコンテンツまたは前記第2のコンテンツに対する制御情報を生成する制御情報生成部と
を備える信号処理装置。
(12)
信号処理装置が、
第1のコンテンツに含まれる音響信号の特徴量の時系列データである第1の特徴量データを算出する特徴量算出ステップと、
前記第1の特徴量データを他の信号処理装置に送信する特徴量送信ステップと、
前記他の信号処理装置から、前記第1の特徴量データと、第2のコンテンツに含まれる音響信号の前記特徴量の時系列データである第2の特徴量データとを用いて生成された、前記第1のコンテンツと前記第2のコンテンツを同期する際に用いられる同期情報を受信する同期情報受信ステップと、
前記同期情報受信ステップの処理により受信された前記同期情報を用いて、前記第1のコンテンツまたは前記第2のコンテンツに対する制御情報を生成する制御情報生成ステップと
を含む信号処理方法。
(13)
コンピュータを、
第1のコンテンツに含まれる音響信号の特徴量の時系列データである第1の特徴量データを算出する特徴量算出部と、
前記第1の特徴量データを他の信号処理装置に送信する特徴量送信部と、
前記他の信号処理装置から、前記第1の特徴量データと、第2のコンテンツに含まれる音響信号の前記特徴量の時系列データである第2の特徴量データとを用いて生成された、前記第1のコンテンツと前記第2のコンテンツを同期する際に用いられる同期情報を受信する同期情報受信部と、
前記同期情報受信部により受信された前記同期情報を用いて、前記第1のコンテンツまたは前記第2のコンテンツに対する制御情報を生成する制御情報生成部と
して機能させるためのプログラム。
(14)
第1のコンテンツに含まれる音響信号の特徴量の時系列データである第1の特徴量データを算出する特徴量算出部と、
前記第1の特徴量データを他の信号処理装置に送信する特徴量送信部と、
前記他の信号処理装置から、前記第1の特徴量データと、第2のコンテンツに含まれる音響信号の前記特徴量の時系列データである第2の特徴量データとを用いて生成された、前記第1のコンテンツと前記第2のコンテンツを同期する際に用いられる同期情報を受信する同期情報受信部と、
前記同期情報受信部により受信された前記同期情報を用いて、前記第1のコンテンツまたは前記第2のコンテンツに対する制御情報を生成する制御情報生成部と
を備える電子機器。
(15)
第1のコンテンツに含まれる音響信号の特徴量の時系列データである第1の特徴量データと、第2のコンテンツに含まれる音響信号の前記特徴量の時系列データである第2の特徴量データとを受信する特徴量受信部と、
前記特徴量受信部により受信された前記第1の特徴量データと前記第2の特徴量データとを用いて、前記第1のコンテンツと前記第2のコンテンツを同期する際に用いられる同期情報を生成する同期情報生成部と、
前記同期情報生成部により生成された前記同期情報を用いて、前記第1のコンテンツまたは前記第2のコンテンツに対する制御情報を生成する制御情報生成部と、
前記制御情報生成部により生成された前記制御情報を送信する制御情報送信部と
を備える信号処理装置。
(16)
信号処理装置が、
第1のコンテンツに含まれる音響信号の特徴量の時系列データである第1の特徴量データと、第2のコンテンツに含まれる音響信号の前記特徴量の時系列データである第2の特徴量データとを受信する特徴量受信ステップと、
前記特徴量受信ステップの処理により受信された前記第1の特徴量データと前記第2の特徴量データとを用いて、前記第1のコンテンツと前記第2のコンテンツを同期する際に用いられる同期情報を生成する同期情報生成ステップと、
前記同期情報生成ステップの処理により生成された前記同期情報を用いて、前記第1のコンテンツまたは前記第2のコンテンツに対する制御情報を生成する制御情報生成ステップと、
前記制御情報生成ステップの処理により生成された前記制御情報を送信する制御情報送信ステップと
を含む信号処理方法。
(17)
第1のコンテンツに含まれる音響信号の特徴量の時系列データである第1の特徴量データを算出する第1の特徴量算出部と、
第2のコンテンツに含まれる音響信号の前記特徴量の時系列データである第2の特徴量データを算出する第2の特徴量算出部と、
前記第1の特徴量算出部により算出された前記第1の特徴量データと、前記第2の特徴量算出部により算出された前記第2の特徴量データとを用いて、前記第1のコンテンツと前記第2のコンテンツを同期する際に用いられる同期情報を生成する同期情報生成部と、
前記同期情報生成部により生成された前記同期情報を用いて、前記第1のコンテンツまたは前記第2のコンテンツに対する制御情報を生成する制御情報生成部と
を備える信号処理システム。
(18)
信号処理システムが、
第1のコンテンツに含まれる音響信号の特徴量の時系列データである第1の特徴量データを算出する第1の特徴量算出ステップと、
第2のコンテンツに含まれる音響信号の前記特徴量の時系列データである第2の特徴量データを算出する第2の特徴量算出ステップと、
前記第1の特徴量算出ステップの処理により算出された前記第1の特徴量データと、前記第2の特徴量算出ステップの処理により算出された前記第2の特徴量データとを用いて、前記第1のコンテンツと前記第2のコンテンツを同期する際に用いられる同期情報を生成する同期情報生成ステップと、
前記同期情報生成ステップの処理により生成された前記同期情報を用いて、前記第1のコンテンツまたは前記第2のコンテンツに対する制御情報を生成する制御情報生成ステップと
を含む信号処理方法。
(19)
第1のコンテンツに含まれる音響信号の特徴量の時系列データである第1の特徴量データを算出する特徴量算出部と、
他の信号処理装置から送信されてくる第2のコンテンツに含まれる音響信号の前記特徴量の時系列データである第2の特徴量データを受信する特徴量受信部と、
前記特徴量算出部により算出された前記第1の特徴量データと、前記特徴量受信部により受信された前記第2の特徴量データとを用いて、前記第1のコンテンツと前記第2のコンテンツを同期する際に用いられる同期情報を生成する同期情報生成部と、
前記同期情報生成部により生成された前記同期情報を用いて、前記第1のコンテンツまたは前記第2のコンテンツに対する再生制御に関する再生制御情報を生成する制御情報生成部と
を備える信号処理装置。